开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 30070|回复: 193
收起左侧

[易语言纯源码] 极速统计数组重复并分类(9.12更新)

  [复制链接]

发表于 2015-9-11 21:54:31 | 显示全部楼层 |阅读模式   江苏省常州市
分享源码
界面截图:
是否带模块: 纯源码
备注说明: -
本帖最后由 birdmanxp 于 2015-9-12 10:53 编辑

之前看到有个定制帖
  1. 数组取每个成员重复次数,并分类列出  数组可呢个比较大 有10万成员左右
复制代码

感觉很有挑战意义,虽然有人已经接单完成了,但因为这种情况很典型,所以有必要跟易友交流互相促进
先讲下算法吧
主要里利用“节点”的特性优化速度,此法速度也许算不上最快的,但算法肯定是最简单的
节点特性1:节点类似与哈希表,当向节点内加入一个新属性时,返回成功,当向节点内加入一个已存在的同名属性时则返回失败,利用这个特性可以很容易判断数组成员是不是重复
节点特性2:虽然无法加入同名的属性,但却可以修同名属性的属性值,利用这点可以记录每个数组成员的重复次数
由此可见,只需要一次计次循环就能完成数组去重+分类统计重复次数,相对于嵌套多层循环比对的方法效率要高得多

根据反复测试的结果,发现一个重要的规律
当数组成员数一样时,统计耗时跟去重后的成员数成反比,也就是说同样为10万数组,去重后为1000个成员的耗时比去重后为100个成员耗时多8~10倍左右
为什么会有这种规律?应该是节点的另一个特性:加入新属性耗时修改已有的属性值要慢得多

以上为本人的一点愚见,欢迎有大神可以分享效率更高的算法。
9.12日重要更新
根据@猥琐小胖子和@ANJIANTEST大神的提示,增加了哈希表法,对于完全不重复的数组统计的效率要比节点法高几百倍(1秒内可以完成10万数组统计分类)。

旧版源码回复可见
统计重复.rar (16.56 KB, 下载次数: 206)

评分

参与人数 10好评 +8 精币 +16 收起 理由
waweiggfnh + 1 + 1 感谢你的支持,精易有你更精彩
外星人群控 + 2 前来道贺
兮若残伤 + 1 大神,你的hash表写法并不能计算出准确的重复次数
村雨 + 1 感谢发布原创作品,精易因你更精彩!
EExiaolin + 1 + 2 感谢发布原创作品,精易因你更精彩!
yinghao2005 + 1 + 1 感谢分享,很给力!~
oldlee + 1 + 2 钻研精神加分
ANJIANTEST + 1 + 1 e的对象调用不够给力,换成汇编版hash表才极速.
猥琐小胖子 + 1 + 5 感谢分享,很给力!~
阿星Star + 1 + 1 涨姿势了,原先我还想用记录集

查看全部评分


本帖被以下淘专辑推荐:

 楼主| 发表于 2015-10-5 19:28:34 | 显示全部楼层   江苏省常州市
感谢@兮若残伤的反馈,发现bug已经修复,更新源码,请重新下载!主要更新:
1、修复哈希表法的统计错误bug
2、将最大值设置为0生成数据可对比节点法和哈希表法的巨大差距(至少100倍以上),一定要编译成exe再测试,不然会等哭的!
统计重复.rar (17.42 KB, 下载次数: 602)
回复 支持 反对

使用道具 举报

结帖率:80% (20/25)

签到天数: 2 天

发表于 2024-1-22 14:21:46 | 显示全部楼层   广西壮族自治区桂林市
66666666666666666666666666666666
回复 支持 反对

使用道具 举报

发表于 2023-11-21 15:49:57 | 显示全部楼层   四川省成都市
非常感谢
回复 支持 反对

使用道具 举报

结帖率:0% (0/1)
发表于 2023-8-14 19:21:39 | 显示全部楼层   湖南省株洲市
66666666666666666666666666666666666666
回复 支持 反对

使用道具 举报

结帖率:100% (15/15)

签到天数: 1 天

发表于 2023-7-27 16:06:05 | 显示全部楼层   浙江省宁波市
谢谢楼主,下载学习....
回复 支持 反对

使用道具 举报

结帖率:57% (4/7)

签到天数: 1 天

发表于 2023-6-5 22:29:08 | 显示全部楼层   广西壮族自治区崇左市
感谢你的支持,精易有你更精彩
回复 支持 反对

使用道具 举报

发表于 2023-1-1 12:53:40 | 显示全部楼层   广东省茂名市
我来拿源码 谢谢大佬
回复 支持 反对

使用道具 举报

结帖率:59% (10/17)
发表于 2022-6-3 02:44:12 | 显示全部楼层   云南省临沧市
我来拿源码 谢谢大佬
回复 支持 反对

使用道具 举报

发表于 2021-2-17 00:05:16 | 显示全部楼层   四川省遂宁市
666666666666
回复 支持 反对

使用道具 举报

签到天数: 4 天

发表于 2020-12-1 10:39:57 | 显示全部楼层   陕西省西安市
先下来学习学习
回复 支持 反对

使用道具 举报

结帖率:63% (24/38)

签到天数: 3 天

发表于 2020-11-5 16:34:14 | 显示全部楼层   辽宁省大连市
不知道我这条回复楼主能不能看到,最近在研究排列组合算法,用了搜索到的好几种算法,都没有楼主的2015年的一个模块速度快,真心佩服楼主的算法功底。如果楼主看到此条回复,是否可以回复一下,想看看楼主的排列组合,尤其是组合算法是怎么写的,为啥就那么快!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 诚聘英才| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 800073686,邮箱:800073686@b.qq.com
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表