把qq群聊天记录导入数据库思路
如果你是一个群主,群里的成员满了,别人进不来,群里面的有部分人又天天在扯皮,不如找出来让位给别人,那就把qq消息导出来导入数据库分析一下,上周五我就做了这工作,下面说说思路,对于正则表达式不熟的我,边学边用,不知不觉周五晚上一至搞到半夜2点钟,呵呵,性格缺陷,有事做不完睡不好
思路开始,首先要想导入数据库你要分行分隔符与列分隔符,打开导出的QQ聊天记录
—————格式如下—————
消息记录(此消息记录为文本格式,不支持重新导入)
================================================================
消息分组:群
================================================================
消息对象:ORACLE技术联盟
================================================================
2010-7-25 23:19:15 (qq号xxxxxx)
不是一个变量嘛
2010-7-25 23:19:18 (xxxxxx)
变量
2010-7-25 23:19:33 (xxxxxx)
是的啊,我查出一个结果赋给变量,不行?
———————部分结束—————
看到这样的格式,你看你怎么导入了,我个人的观点是学东西要活学活用,不用为了数据库而数据库,如果其它方法能实现为什么你非想sql,就好比算帐,你背的珠算口绝再多,能比用电子计算器来的快么?我觉的是思路比做法更重要
1,行分隔符
你会发现每消息/人次,是以日期格式开头,以(qq号)或<邮箱> 结尾,那你就用正则找出这行,在日期前面插入一个行分隔符。
这样在qq消息中如果有复制别人消息的带日期的可能当做一条新记录,等你确认
2,列分隔符
比如:
2010-7-25 23:19:15 (qq号xxxxxx)
message
———
行分隔符+日期开头,截至日期后插入列分隔符,日期列;
行分隔符+日期开头,并且(数值)or
然后就导入数据库吧,sql loader也好,toad也好,plsql dev..好多工具
总结:用ue利用正则插分隔符,再导入数据库进一步处理
目前这篇文章有3条评论(Rss)评论关闭。