[size=large]我以前是学嵌入式的,本专业还没学深呢,导师让搞数据挖掘,还是Web的文本挖掘......
要做一个小项目,比如同仁、协和、301之类的知名医院,把他们的主任医师的信息爬下来,分类为内科、儿科、耳鼻喉...... 然后按姓名、出生年月,毕业院校,擅长治疗方向,和大体的介绍分门别类的抽取、入库,然后搞个展示界面显示出来,方便患者选择。
个人感觉像我这样的新手,本身在程序方面悟性又差,时间又紧,自己从头写代码估计会被导师吃了,都怕所里不让我毕业了,心里很焦虑啊。
在open-open上看到了十几个开源项目,不知道选哪个好?Heritrix? WebLech? Web-Harvest? 其他的? 或者就不该从open-open的开源程序里选?
请有空理会这个没有营养的烂帖的好心前辈们根据[color=blue]新手易上手,开发门槛低,能满足我前面说的项目要求[/color]的角度给个推荐!
太谢谢了!![/size]