算法:先有格式化数据再生成类目的思维

潘先生 日期:2017-07-29

算法:先有格式化数据再生成类目的思维

先有格式化数据再生成类目的思维,当采集到大量的格式化数据的时候,比如商品数据。有id,分类,标题等字段。如何进行归类呢?


可以先用group by 分类,取出所有的分类;


1,新建一个归类表,做二次归类

结构如下:

id,mulu,mulumd,guilei,


实现自动归类

1,数据库中取出所有sp,(id,spmulu,)新增guilei字段,

2,数据库中取出所有mulu(id,mulu,mulumdf,guilei)

2,循环sp,取出spmulu 转化成sp_mulumdf(md)

if sp_mulumdf 在mulu_mulumdf中,就取出guilei

if guilei为真,就将其更新到sp记录的字段

else

sp_mulumdf 不在mulu_mulumdf,将spmulu,写入mulu表,等待将mulu表中的mulu归类(即手动更新mulu_guilei信息)后再重新执行


以后可以简单的修改第一步:

取出所有没有归类的sp,guilei为0的记录;这样可以省一些事。


思维优化:


1,找出sp_mulumdf 不在mulu_mulumdf中的mulu,mulumdf,再插入mulu表;

2,循环mulu中的mulumdf,在sp中找mulumdf相同的记录,然后更新sp中的guilei

需要手动更新mulu_guilei信息后再次执行

关键词: 生成类目,

属分类: 数据

0 0
网圵:http://127.0.0.13/Article/show/i/489.html

上一篇:采集公告数据

下一篇: 没有了

留言:
登录  注册
三思而后言,谢谢。