在Golang中利用唯一数组值进行并发映射操作
来源:stackoverflow
时间:2024-03-18 22:09:34 103浏览 收藏
在 Go 语言中,使用并发映射可以高效地存储和检索数据。然而,当需要向映射中添加唯一值时,使用线性扫描检查重复项的方法会变得低效,尤其是当数据集庞大时。为了提高效率,可以使用其他数据结构,例如嵌套映射,来避免线性扫描。通过使用空结构作为映射中的值,可以优化内存使用并提高查找性能。
我正在迭代 flatproduct.catalogs
切片并在 golang 中填充我的 productcatalog
并发映射。我正在使用 upsert 方法,以便只能将唯一的 productid 的
添加到我的 productcatalog
地图中。
这使用线性扫描来检查重复的产品 id,但就我而言,我有超过 700k 个产品 id,因此对我来说非常慢。我正在寻找提高效率的方法。
下面的代码由多个 goroutine 并行调用,这就是为什么我在这里使用并发映射来将数据填充到其中。
var productrows []clientproduct err = json.unmarshal(byteslice, &productrows) if err != nil { return err } for i := range productrows { flatproduct, err := r.convert(spn, productrows[i]) if err != nil { return err } if flatproduct.statuscode == definitions.done { continue } r.products.set(strconv.itoa(flatproduct.productid, 10), flatproduct) for _, catalogid := range flatproduct.catalogs { catalogvalue := strconv.formatint(int64(catalogid), 10) // how can i improve below upsert code for `productcatalog` map so that it can runs faster for me? r.productcatalog.upsert(catalogvalue, flatproduct.productid, func(exists bool, valueinmap interface{}, newvalue interface{}) interface{} { productid := newvalue.(int64) if valueinmap == nil { return []int64{productid} } oldids := valueinmap.([]int64) for _, id := range oldids { if id == productid { // already exists, don't add duplicates. return oldids } } return append(oldids, productid) }) } }
上面的 upsert 代码对我来说非常慢,并且需要花费大量时间在我的并发映射中添加唯一的产品 id 作为值。以下是 productcatalog
的定义方式。
productcatalog *cmap.concurrentmap
这是我正在使用的 upsert
方法 - https://github.com/orcaman/concurrent-map/blob/master/concurrent_map.go#l56
这就是我从这个 cmap 读取数据的方式:
catalogProductMap := clientRepo.GetProductCatalogMap() productIds, ok := catalogProductMap.Get("200") var data = productIds.([]int64) for _, pid := range data { ... }
正确答案
总结评论中的答案:
upsert 函数的复杂度为 o(n**2),其中 n 是切片的长度。
您还提到的问题是迭代整个切片以查找重复项。使用其他地图可以避免这种情况。
示例:
r.productCatalog.Upsert(catalogValue, flatProduct.ProductId, func(exists bool, valueInMap interface{}, newValue interface{}) interface{} { productID := newValue.(int64) if valueInMap == nil { return map[int64]struct{}{productID: {}} } oldIDs := valueInMap.(map[int64]struct{}) // value is irrelevant, no need to check if key exists oldIDs[productID] = struct{}{} return oldIDs })
嵌套映射会添加大量分配,导致大量内存使用,对吗?
不,使用空结构不会创建新的分配或增加内存使用量。您可以找到大量有关空结构及其用法的文章/问题。 (例如What uses a type with empty struct has in Go?)
注意:您可以对数组使用某种优化搜索,例如 sort.Search 使用的二分搜索,但它需要排序数组。
今天关于《在Golang中利用唯一数组值进行并发映射操作》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于的内容请关注golang学习网公众号!
-
502 收藏
-
502 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
139 收藏
-
204 收藏
-
325 收藏
-
477 收藏
-
486 收藏
-
439 收藏
-
357 收藏
-
352 收藏
-
101 收藏
-
440 收藏
-
212 收藏
-
143 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习