CSSCI下载的题录txt数据如何转化成Excel？

CSSCI下载的题录数据如下：

每条文献数据之间有“——”分隔。

如何批量的转化成以下格式？

求赐教谢谢！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

CSDN专家-孙老师 2021-04-09 23:29

关注

用Python可以实现批量处理，假设有这样一个txt文件。

【来源篇名】大学图书馆1
【英文篇名】Discussion on the1
【来源作者】陈建龙1
【基金】
【参考文献】
1.张国有
2.李大钊
--------------------------------------------

【来源篇名】大学图书馆2
【英文篇名】Discussion on the2
【来源作者】陈建龙2
【基金】
【参考文献】
1.张国有
2.李大钊
3.张国有
4.李大钊
--------------------------------------------

【来源篇名】大学图书馆3
【英文篇名】Discussion on the3
【来源作者】陈建龙3
【基金】
【参考文献】
1.张国有
2.李大钊
3.李大钊
--------------------------------------------

【来源篇名】大学图书馆4
【英文篇名】Discussion on the4
【来源作者】陈建龙4
【基金】
【参考文献】
1.李大钊
--------------------------------------------

代码可以这样写：

#首先将txt文件的最后加上一行跟上面的虚线，代表结束标记

#读取txt文件的内容
import pandas as pd

data=pd.read_csv('data/题录数据.txt',header=None,names=['data'])
data.head(10)

#获取名称
names=[]

for i in range(5):
    names.append(re.findall('(【.*?】).*?',data['data'][i])[0])

print(names)

#获取参考文献及虚线对应的index
arr1=data[data['data']=='【参考文献】'].index.values
arr2=data[data['data']=='--------------------------------------------'].index.values

data_df=pd.DataFrame(columns=names)

#获取个字段的值，除了参考文献
for j in range(len(arr1)-1):
    values=[]
    for i in range(arr2[j]+1,arr1[j+1]+1):
        values.append('/'.join(re.findall('】(.*)',data['data'][i])))
        
    data1=pd.DataFrame(values).T
    data1.columns=names
    data_df=pd.concat([data_df,data1],axis=0)

#获取参考文献，并填入数据框
for j in range(len(arr1)-1):
    ref=[]
    for i in range(arr1[j]+1,arr2[j]):
        ref.append(data['data'][i])
    #print('|'.join(ref))
    data_df.iloc[j,4]='|'.join(ref)

#保存到Excel文件中
data_df.to_excel('data/data_df.xlsx',index=None)

csdn的服务器貌似有点问题，图片发不上来。

这个代码结合你的文件再修改下，就OK了。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(3条)

报告相同问题？

关注问题

CSSCI下载的题录txt数据如何转化成Excel？ python r语言 sql 有问必答
2021-04-09 19:41

回答 4 已采纳用Python可以实现批量处理，假设有这样一个txt文件。【来源篇名】大学图书馆1 【英文篇名】Discussion on the1 【来源作者】陈建龙1 【基金】【参考文献】 1.张国有 2
互联网在线学习行为研究的热点及趋势——基于CSSCI和SCI文献的CiteSpace可视化分析.pdf
2021-07-15 20:30

互联网在线学习行为研究的热点及趋势——基于CSSCI和SCI文献的CiteSpace可视化分析.pdf
【科学文献计量】CSSCI数据采集，转化为python中的DataFrame格式，并存放到MySQL数据库
2022-03-22 17:17

lys_828的博客 CSSCI数据采集，转化为python中的DataFrame格式，并存放到MySQL数据库1 CSSCI数据采集2 数据加载到python中并进行DataFrame类型转化3 将DataFrame数据存放到MySQL数据库4 将MySQL数据库中的表格读取到python中 ...
cssci.rar_CSSCI EXPO_cssci怎么导出_期刊索引
2022-09-21 17:28

导出cssci数据，中国人文期刊数据库检索，中文社会科学引文索引指导委员会
经管类CSSCI、北核期刊投稿指南数据（2023年更新）.zip
2024-01-10 22:51

经管类CSSCI、北核期刊投稿指南（2023年更新）/经管类期刊投稿指南内容包括：投稿指南-CSSCI版本、CSSCI扩展版本、北大核刊版本、建议期刊版本、所有期刊。范围：CSSCI、CSSCI扩展、北大核刊说明：包含经管类期刊...
CSSCI各学科引用因子排名
2022-07-06 13:52

CSSCI各学科引用因子排名
Python数据挖掘-CNKI知网
2024-04-05 09:39

知网资源。 Python数据挖掘-CNKI知网。图书情报学领域的研究者。在写作文献计量学的文章时需要进行数据分析以及文献...数据来源说明：出媒体融合+人工智能大数据主题下，来自北大核心、EI、CSD、SCI、CSSCI期刊的文献。
SCI EI ISTP SSCI CSSCI CSCD分别代表了什么意思？
2015-07-07 23:01

AIGIS.的博客目前，教育部已将CSSCI数据作为全国高校机构与基地评估、成果评奖、项目立项、名优期刊的评估、人才培养等方面的重要指标。CSSCI数据库已被北京大学、清华大学、中国人民大学、复旦大学、国家图书馆、中科院等100多...
CSSCI+扩展版来源期刊目录（2019-2020年）.pdf
2019-06-22 13:12

CSSCI来源期刊目录（2019-2020）！【南大核心】.pdf，需要下载的从速！
所有投稿邮箱汇总（经管类可投，CSSCI刊物）
2022-07-06 18:19

所有投稿邮箱汇总（经管类可投，CSSCI刊物）
CSSCI扩展版(2019-2020)目录.pdf
2020-03-31 19:10

CSSCI 扩展版来源期刊（2019 年-2020 年）目录,（共214 种，分学科按刊名音序排列）
完整上市公司多元化经营数据四大指标数据集构造（2000-2022），数据可直接匹配！
2024-04-09 19:18

多元化战略/多元化经营数据构造（2000-2022）借鉴杨兴全, 任小毅, 杨征（2020）、仓勇涛, 储一昀, 范振宇（2020）、杨兴全, 尹兴强, 孟庆玺（2018）等顶刊的做法，构造多元化经营数据。该数据4大指标的构造可...
基于CSSCI期刊的高校数字图书馆论文的统计分析
2020-01-15 06:18

基于CSSCI期刊的高校数字图书馆论文的统计分析，陈辰，王克平，本文以CSSCI期刊为数据来源，利用SATI、EXCEL、SPSS和UCINET四个软件对2001年－2014年我国有关高校数字图书馆的论文进行统计分析，主要统计�
英语语言学c刊目录,外语类CSSCI核心期刊（2017-2018）
2021-05-24 07:00

weixin_39976951的博客外语类CSSCI核心期刊(2017-2018)作者:wlhuang 日期:2018-11-19字体大小: 小中大 CSSCI收录来源期刊(2017-2018)：语言学(24种)期刊名称CN号当代修辞学 31-2043/H 2当代语言学 11-3879/H 3方言...
AI时代编程新宠！如何让孩子成为未来的编程大师？
2024-03-02 12:23

程序边界的博客其中前6 部分内容分别为编程平台介绍、计算机基础知识、从图形化编程到C++ 入门、数学知识基础、数据结构和算法补充与归纳。第七部分给出2019—202年CSP-J/S 真题及参考答案。本书基于图形化编程学习，详细介绍由...
CSSCI来源期刊目录（2019-2020）.pdf
2020-02-17 13:00

CSSCI来源期刊目录（2019-2020）
语言文字杂志是c刊吗,语言类cssci期刊有哪些
2021-05-25 02:04

GaryMarcus的博客语言类cssci期刊有哪些作者：核心期刊目录查询发布时间：2021-03-01语言(Language)是人类进行沟通交流的表达方式。一般来说，各个民族都有自己的语言，语言是民族的重要特征之一。根据语言的要素特征和起源关系，把...
最新版CSSCI来源期刊目录
2016-07-27 17:21

最新版CSSCI内容发布。欲了解，从速。
CSSCI中文社会科学引文索引(2019-2020)收录来源期刊目录(含扩展版).xlsx
2020-11-13 18:34

中文社会科学引文索引英文全称为“Chinese Social Sciences Citation Index”，缩写为CSSCI。由南京大学中国社会科学研究评价中心开发研制的数据库，用来检索中文社会科学领域的论文收录和文献被引用情况，是我国...
民族经济类毕业论文文献包含哪些？
2022-01-05 16:04

六维论文推荐的博客冲突产生受内外因素双重影响二、语言权利与民族语言的价值确认 (一)语言权利的保护对象应是语言使用者而非语言 1．保护人而非语言 2．保护个人而非集体 (二)权利主体对保护民族语言负有道德责任 1．道德责任的内涵 ...
没有解决我的问题, 去提问

悬赏问题

¥15 C语言设计一个简单的自动换档程序
¥15 关于logstash转发日志时发生的部分内容丢失问题
¥17 pro*C预编译“闪回查询”报错SCN不能识别
¥15 微信会员卡接入微信支付商户号收款
¥15 如何获取烟草零售终端数据
¥15 数学建模招标中位数问题
¥15 phython路径名过长报错不知道什么问题
¥15 深度学习中模型转换该怎么实现
¥15 Stata外部命令安装问题求帮助！
¥15 从键盘随机输入A-H中的一串字符串，用七段数码管方法进行绘制。提交代码及运行截图。

码龄粉丝数原力等级 --

CSSCI下载的题录txt数据如何转化成Excel？

4条回答默认最新

码龄粉丝数原力等级 --

悬赏问题

CSSCI下载的题录txt数据如何转化成Excel？

4条回答 默认 最新

悬赏问题

4条回答默认最新