Excel如何快速提取复杂混乱数据?

首选必须要说明的是对于,复杂混乱的数据使用快速填充,也就是Ctrl+E很多情况下是无法将数据正确的提取出来的,使用Ctrl+E的一个大前提就是数据源具有明确的数据规律

如果说在一个单元格中输入了2类相同的结构的数据如下图,大多数是没有什么好的办法,只能一个一个的提取,才能保证准确率

这里分享一种提取杂乱的数据但是一个单元格中必须仅包含一种数据结构,需要借助word来实现,首先将数据粘贴进word中,然后按CTRL+H调出替换窗口,然后在查找值输入[!0-9],,替换为什么都不要输入,然后选项勾选使用通配符,然后点击全部替换,就会替换掉除了数字之外的所有数据,然后粘贴进excel即可,如下视频

Excel如何快速提取复杂混乱数据?

回答这个问题之前,需要对混乱复杂进行界定。

我简单把混乱复杂区分为三种类型:一是数据结构混乱复杂,二是数据内容混乱复杂,三是两者都有。

结构混乱复杂

最典型的例子是中国式表格:合并单元格,存在表格名称,小计混杂在数据行中。

另一种结构复杂的例子是类似于人员履历表这样的。设计的时候并不是考虑数据汇总统计,所以字段和字段的内容交错在行和列中。

第三种结构复杂的例子是原始数据被透视后形成的透视表。

这类结构复杂的Excel数据整理起来非常困难,几乎没有一个通用的办法,必须具体问题具体分析。

比如合并单元格可以简单拆散后填充,混杂的小计和合计可以用筛选剔除,透视表可以逆透视还原。

内容混乱复杂

比如文本前后中间有不必要的空格,对同一个事物有不同的名称,或者有不同的表达形式。最常见的是商品规格乱写,或者单位名称简写全称混杂。

相对于结构混乱复杂的表格而言,内容混乱复杂处理的技术难度并不大,基本就是查找替换,但是工作量巨大,比如把同一个东西的叫法统一起来就不是技术问题,而是业务和规范问题。

两者都有

遇到这种结构和内容都混乱的表格,真的会有打人的冲动。

我的建议是先处理结构混乱,再处理内容混乱。是先难后易——如果结构混乱处理不好,内容处理了也没啥用处。

powerquery神器

powerquery是数据收集和清洗的神器,Excel能干的它都能干,Excel不能干的它也能干。

为什么要推荐它呢?这是因为工作中我们遇到的混乱复杂表格情况,绝不会是偶尔遇到,一定是经常遇到。所以,powerquery这类辛苦一次永久使用的工具是最佳选择——第一次处理好之后,将来处理同样的问题只需要刷新下即可,不用同样的操作反复一遍又一遍地做。

Excel如何快速提取复杂混乱数据?

针对各种不同的复杂的数据处理,比较好用的方式就是数组

VBA的数字搭配filter()函数,在快速处理大数据的方面,有非常不错的效果,速度也是非常的快

如果不是很熟悉数组的话,可以考虑使用like()方法,通过模糊查找或者是精确查找的方式,也能够将各种复杂结构的数据找出来

另外也可以采用正则表达式,在VBA中也有正则表达式,可以将数字,汉子,英文或者是固定电话,身份证,邮箱等各种奇怪的数据找出来

内容仅供参考,如果您需解决具体问题(尤其法律、医学等领域),建议您详细咨询相关领域专业人士。

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请与我们联系,我们将及时删除。

相关推荐