前几天提取了一个网站的信息大概有6万多条公司信息;只是信息格式并不是统一的.为了完成信息的格式化用了以下方法
一.用C#程序的方法来处理,如果一些信息是不规则的那么很难做到格式的统一而且极有可能错位造成程序的格式化异常
二.利用数据库来完成这样的处理但时间上很难预计,如果才能做到快速是一个问题
最后的方案是利用最简单的办法用数据库来解决这样的问题
增加相应的字段来标识国家与是否处理
匹配国别完成后设置已处理
6万多条数据大概处理了1小时,相信还有更快的办法如全文索引。能完成任务对这种方法还算满意

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/42993.html