|
本帖最后由 bug0088 于 2024-1-26 10:22 编辑
我问了GPT,给出了几种方案,但都不行,球球各位远胜GPT的大佬。
我有两份数据,分别储存在sheet1和sheet2的A列。其他情形如下:
(1)sheet1的数据有10000行,sheet2的数据有6000行。
(2)sheet2的数据全部来自于sheet1(包括顺序和内容),但是有一些整行缺失。
(3)sheet1和sheet2的数据本身存在一定的重复,比如sheet1的500行有数据“Hello, Tom.”,第700行可能也存在数据“Hello, Tom.”
要求:
(1)从sheet1的数据中找出sheet2的数据的缺失处,并以“Missing Data"在sheet1的B列中标识出来。
(2)考虑到数据本身存在一定的重复,sheet2的数据在进行匹配时只能按顺序使用一次。
(3)可能不要使用vlookup函数,因为有些单行里的数据太长,vlookup会返回#VALUE!。(我自己试过两边同时左取50个字符再V,但担心精度问题)
GPT给出的几种方案,分别是:
1.在 sheet1 的 B 列中使用
=IF(COUNTIF(Sheet2!$A$1:$A$6000, $A1) = 0, "Missing Data", "")
结论:估计是某些数据过长的原因,这个公式使用了之后,B列中有些返回错误#VALUE!
2.在 sheet1 的 B 列中使用
=IF(ISNUMBER(MATCH(A1, Sheet2!$A$1:$A$6000, 0)), "", "Missing Data")
结论:B列中"Missing Data"的数量远小于4000(10000-6000)
3.在 sheet1 的 B 列中使用
=IF(COUNTIF($B$1:B1, "")>0, "", IF(COUNTIF(Sheet2!$A$1:$A$6000, $A1)>COUNTIF($B$1:B1, ""), "Missing Data", ""))
=IF(COUNTIF($B$1:B1, "")>0, "", IF(ISNUMBER(MATCH(A1, Sheet2!$A$1:$A$6000, 0)), "", "Missing Data"))
结论:以上两个公式均提示循环引用
4.
在 sheet1 的 C 列中使用=IF(ISNUMBER(MATCH(A1, Sheet2!$A$1:$A$6000, 0)), "", "Missing Data")
在 sheet1 的 B 列中使用=IF(COUNTIF($C$1:C1, "Missing Data")>0, "", IF(ISNUMBER(MATCH(A1, Sheet2!$A$1:$A$6000, 0)), "", "Missing Data"))
结论:"Missing Data"的数量远小于4000(10000-6000)
再次,球球各位远胜GPT的大佬。 |
|