关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
limex_11037
2021-12-02 11:15
采纳率: 80%
浏览 27
首页
有问必答
已结题
怎么通过Python爬虫来制造一个语料
有问必答
python
爬虫
深度学习
求助各位姥爷,想了解怎么把一个TXT文件里面的内容做成一个语料,
收起
写回答
好问题
0
提建议
关注问题
微信扫一扫
点击复制链接
分享
邀请回答
编辑
收藏
删除
收藏
举报
2
条回答
默认
最新
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
CSDN专家-黄老师
2021-12-02 11:53
关注
你只能通过爬虫去爬取别人发上网的语料,每个自然语言的模块语料格式都不相同,一般官方都会提供
本回答被题主选为最佳回答
, 对您是否有帮助呢?
本回答被专家选为最佳回答
, 对您是否有帮助呢?
本回答被题主和专家选为最佳回答
, 对您是否有帮助呢?
解决
无用
评论
打赏
微信扫一扫
点击复制链接
分享
举报
评论
按下Enter换行,Ctrl+Enter发表内容
查看更多回答(1条)
向“C知道”追问
报告相同问题?
提交
关注问题
基于
python
实现豆瓣Top250影评
爬虫
(用于情感分析
语料
)
2024-07-12 11:47
【作品名称】:基于
python
实现豆瓣Top250影评
爬虫
(用于情感分析
语料
) 【适用人群】:适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 【项目介绍...
python
语料
爬虫
2017-10-31 12:48
Python
语料
库
爬虫
是自然语言处理(NLP)领域中的
一个
重要工具,它主要用于自动收集、整理和存储大量文本数据,这些数据可以用于训练模型、分析语言模式或进行其他相关研究。下面将详细介绍如何利用
Python
编写
一个
...
Python
爬虫
库框架学习及
Python
高度匿名代理IP
2023-04-06 11:15
Python
网络
爬虫
是一种用于自动化获取网页内容的工具,学习
Python
爬虫
主要分为三个核心部分:抓取、分析和存储。本文将详细介绍其中的关键知识点和常用库。 首先,我们来看看网络
爬虫
的基础——抓取阶段。当我们在...
Python
爬虫
获取多语种日常用语平行
语料
-外语学习
2024-02-14 15:12
2402_82964571林的博客
用
Python
爬虫
获取多语种日常用语平行
语料
,可用于外语学习、自然语言处理研究。
python
104特色饮食情感分析
语料
库模型建立wlw.rar
2024-04-26 00:13
一个
有效的
语料
库需要涵盖大量的文本数据,包括正面和负面的评价,以便训练模型识别不同情感。在特色饮食领域,这可能包括餐厅评论、菜品评价等。构建
语料
库时,可能采用了
爬虫
技术从网络上获取数据,或者直接购买已...
Python
爬虫
基础——数据清洗
2025-01-08 15:22
白雪公主的后妈的博客
############################## ##作者:白雪公主的后妈 ##时间:2024年1月7日 ##主题:
Python
爬虫
基础——数据清洗 ##主要内容:对采集到的原始数据中的缺失值、重复值、异常值或乱码,进行处理 ################...
python
爬虫
新闻标题
语料
库搜索引擎系统设计
2024-05-12 08:22
QQ242219979的博客
(1)数据抓取,也叫数据收集模块,即新华网新闻标题的网络抓取技术,这是整个系统的基础所在,使用
Python
语言利用网络
爬虫
动态获取新闻网的标题,然后对得到的源新闻标题数据进行人工处理,构建新闻网标题
语料
库,...
【
语料
数据
爬虫
】
Python
爬虫
|批量采集讲话稿数据(1)
2025-03-09 14:35
写python的鑫哥的博客
本文是该专栏的第6篇,后面会持续分享
Python
爬虫
采集各种
语料
数据的的干货知识。在本文中,笔者将主要来介绍基于
Python
,来实现批量采集“讲话稿”数据。同时,本文也是采集“讲话稿”数据系列的第1篇。采集相关数据...
python
爬虫
源码
2019-05-03 20:10
用
python
爬取百度贴吧,而后对
语料
进行处理。利用结巴分词,使用
python
3,需要自行下载各种库如jieba。而后还有统计词频和关键词提取,功能比较全,但是可能运行起来比较慢。
Python
-微博终结者
爬虫
2019-08-10 07:28
总结起来,"
Python
-微博终结者
爬虫
"项目是利用
Python
爬虫
技术对抗微博的反爬机制,从社交媒体中大规模采集中文对话
语料
,为NLP研究提供宝贵资源。该项目不仅展示了
Python
在Web
爬虫
领域的强大能力,还揭示了如何巧妙...
python
爬虫
获取新华字典的数据
2023-03-07 08:52
Veyit的博客
使用
python
爬虫
字典中的汉字
python
3
爬虫
爬新闻
2018-10-24 10:46
pyhton3.6爬取凤凰网新闻,输出txt。后续
语料
处理,BSBI算法实现索引程序,中文
语料
处理,择日再传^_^
没有解决我的问题,
去提问
向专家提问
向AI提问
付费问答(悬赏)服务下线公告
◇ 用户帮助中心
◇ 新手如何提问
◇ 奖惩公告
问题事件
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
已结题
(查看结题原因)
6月17日
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
已采纳回答
6月15日
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
创建了问题
12月2日