ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

EH搜索     
EH云课堂-专业的职场技能充电站 Excel转在线管理系统,怎么做看这里 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
Excel不给力? 何不试试FoxTable! Excel 2016函数公式学习大典 EH云课堂直播课程免费学 打造核心竞争力的职场宝典
300集Office 2010微视频教程 Tableau-数据可视化工具 精品推荐-800套精选PPT模板,点击获取 ExcelHome出品 - VBA代码宝免费下载
你的Excel 2010实战技巧学习锦囊 欲罢不能, 过目难忘的 Office 新界面 Excel VBA经典代码实践指南
查看: 7120|回复: 12

关于用EXCEL_VBA调用Windows_API 计算MD5的问题!

[复制链接]

TA的精华主题

TA的得分主题

发表于 2013-7-15 11:03 | 显示全部楼层 |阅读模式
本帖已被收录到知识树中,索引项:保护和加密编程
    我想在EXCEL_VBA中计算MD5。虽然网上有用纯VBA实现的MD5程序,可速度还是太慢了。用API来计算应该快很多!可惜找了很久也没找到在VBA下调用API计算MD5的例子。自己试着写了一个试验程序,可就是通不过!
有哪位大佬可以帮我解决这个问题吗?
我写的试验程序如下:

Declare Function MD5Init Lib "Cryptdll.dll" (ctx As md5_ctx) As Variant
Declare Function MD5Update Lib "Cryptdll.dll" (ctx As md5_ctx, ByVal buf As String, ByVal lend As Integer) As Variant
Declare Function MD5Final Lib "Cryptdll.dll" (ctx As md5_ctx) As Variant
Type md5_ctx
    i(1) As Long
    buf(3) As Long
    inp(63) As String
    digest(15) As String
End Type

Sub aaa()
    Dim ctx As md5_ctx, buf As String, lend As Integer

    buf = "12334"
    lend = Len(buf)
    MD5Init (ctx)               '此处通不过!
    a = MD5Update(ctx, buf, lend)
    MD5Final (ctx)
End Sub





TA的精华主题

TA的得分主题

 楼主| 发表于 2013-7-15 12:39 | 显示全部楼层
快沉了, 自己顶一下! 有高手愿意帮忙吗?

TA的精华主题

TA的得分主题

发表于 2013-7-15 13:12 | 显示全部楼层
本帖最后由 Moneky 于 2013-7-15 13:31 编辑

参考这里的代码试试:http://www.mathtool.cn/computer/system/395.htm
  1. Option Explicit
  2. Option Base 0

  3. Public Type MD5_CTX
  4.     i(1) As Long
  5.     buf(3) As Long
  6.     inc(63) As Byte
  7.     digest(15) As Byte
  8. End Type

  9. Public Declare Sub MD5Init Lib "Cryptdll.dll" (ByVal pContex As Long)
  10. Public Declare Sub MD5Final Lib "Cryptdll.dll" (ByVal pContex As Long)
  11. Public Declare Sub MD5Update Lib "Cryptdll.dll" (ByVal pContex As Long, ByVal lPtr As Long, ByVal nSize As Long)

  12. Public Function ConvBytesToBinaryString(bytesIn() As Byte) As String
  13.     Dim i As Long
  14.     Dim nSize As Long
  15.     Dim strRet As String
  16.    
  17.     nSize = UBound(bytesIn)
  18.     For i = 0 To nSize
  19.          strRet = strRet & Right$("0" & Hex(bytesIn(i)), 2)
  20.     Next
  21.     ConvBytesToBinaryString = strRet
  22. End Function

  23. Public Function GetMD5Hash(bytesIn() As Byte) As Byte()
  24.     Dim ctx As MD5_CTX
  25.     Dim nSize As Long
  26.    
  27.     nSize = UBound(bytesIn) + 1
  28.    
  29.     MD5Init VarPtr(ctx)
  30.     MD5Update ByVal VarPtr(ctx), ByVal VarPtr(bytesIn(0)), nSize
  31.     MD5Final VarPtr(ctx)
  32.    
  33.     GetMD5Hash = ctx.digest
  34. End Function

  35. Public Function GetMD5Hash_Bytes(bytesIn() As Byte) As String
  36.     GetMD5Hash_Bytes = ConvBytesToBinaryString(GetMD5Hash(bytesIn))
  37. End Function

  38. Public Function GetMD5Hash_String(ByVal strIn As String) As String
  39.     GetMD5Hash_String = GetMD5Hash_Bytes(StrConv(strIn, vbFromUnicode))
  40. End Function

  41. Public Function GetMD5Hash_File(ByVal strFile As String) As String
  42.     Dim lFile As Long
  43.     Dim bytes() As Byte
  44.     Dim lSize As Long
  45.    
  46.     lSize = FileLen(strFile)
  47.     If (lSize) Then
  48.         lFile = FreeFile
  49.         ReDim bytes(lSize - 1)
  50.         Open strFile For Binary As lFile
  51.         Get lFile, , bytes
  52.         Close lFile
  53.         GetMD5Hash_File = GetMD5Hash_Bytes(bytes)
  54.     End If
  55. End Function
复制代码


TA的精华主题

TA的得分主题

发表于 2013-7-15 13:37 | 显示全部楼层
要获取“1235”的md5可以这样调用

sub test
    dim s as string
    s=GetMD5Hash_String("1235")
end sub

TA的精华主题

TA的得分主题

 楼主| 发表于 2013-7-15 14:09 | 显示全部楼层
Moneky 发表于 2013-7-15 13:12
参考这里的代码试试:http://www.mathtool.cn/computer/system/395.htm

{:soso_e179:} 非常感谢! 正是我需要的!正在调试,看看比纯VBA的快多少。

TA的精华主题

TA的得分主题

 楼主| 发表于 2013-7-15 18:30 | 显示全部楼层
Moneky 发表于 2013-7-15 13:37
要获取“1235”的md5可以这样调用

sub test

再次感谢!我是要用MD5码来做散列,查找重复行。刚才测试了一下,API 散列的速度是纯VBA散列速度的10倍!现在用VBA程序查找1亿1千9百万行文本重复情况耗时是45小时,网上下载的免费程序要耗时15个月!

TA的精华主题

TA的得分主题

发表于 2013-7-15 18:51 | 显示全部楼层
老谭酸菜 发表于 2013-7-15 18:30
再次感谢!我是要用MD5码来做散列,查找重复行。刚才测试了一下,API 散列的速度是纯VBA散列速度的10倍! ...

干什么的啊,那么多数据?

TA的精华主题

TA的得分主题

 楼主| 发表于 2013-7-15 19:03 | 显示全部楼层
Moneky 发表于 2013-7-15 18:51
干什么的啊,那么多数据?

呵呵,处理字典文件。 网上找的的程序太慢了所以就自己写。算法的力量真神奇!

TA的精华主题

TA的得分主题

发表于 2013-7-15 21:03 | 显示全部楼层
本帖最后由 liucqa 于 2013-7-15 23:00 编辑
老谭酸菜 发表于 2013-7-15 19:03
呵呵,处理字典文件。 网上找的的程序太慢了所以就自己写。算法的力量真神奇!

没必要都做hash吧,你看看能不能分两步。

第一步简单判断,第二步hash判断
或者在建立数据的时候,就做个索引表

做hash开销很大的

TA的精华主题

TA的得分主题

 楼主| 发表于 2013-7-28 12:34 | 显示全部楼层
liucqa 发表于 2013-7-15 21:03
没必要都做hash吧,你看看能不能分两步。

第一步简单判断,第二步hash判断

这个方法好象行不通哦。要处理的文本行数可能很大,不能用工作表来处理,只能用程序对文件进行处理。VBA数组不能定得太大,否则必定出现溢出错误。对行进行排序比查重复行开销还大。而且要保证输出的结果和原始文件中的行顺序一致,只是去掉了重复的行。当然,可能是我水平不够,还理解不了大侠的思路。
附上的写好的程序,有兴趣的朋友可以帮助改进一下。
另:写好程序的第二天就帮单位处理了一个20多万行的文本,不过不是查重复行,是过滤出包含特定字符串的行。
文本文件截断与过滤1.51.rar (74.44 KB, 下载次数: 74)
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

关注官方微信,每天学会一个新技能

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2019-12-16 15:05 , Processed in 0.406466 second(s), 18 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2020 Wooffice Inc.

   

沪公网安备 31011702000001号 沪ICP备11019229号

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:徐怀玉律师 李志群律师

快速回复 返回顶部 返回列表