炸鸡到底要不要加辣 2022-11-08 16:13 采纳率: 0%
浏览 50
已结题

wikidata文件提取

问题:我需要把下面wikidata的某些数据提取出来,最后提取结果保存为json,xlsx等文件。

1.文件太大,就不上传了,文件内容来自wikidata。
2.具体来说,提取某个人的father,mother,sibling,spouse,child,relative,sex or gender, country of citizenship这些。

img

  • 写回答

4条回答 默认 最新

  • 游一游走一走 2022-11-08 16:39
    关注
    1. 可以参考这段代码,大的json文件解析
    import ijson
    
    user_to_repos = {}
    
    with open("large-file.json", "rb") as f:
        for record in ijson.items(f, "item"):
            user = record["actor"]["login"]
            repo = record["repo"]["name"]
            if user not in user_to_repos:
                user_to_repos[user] = set()
            user_to_repos[user].add(repo)
    
    1. 大的json文件写入
    with open('big_json_array.json', 'w') as out:
        json.dump(data, out)
    
    评论 编辑记录

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 11月15日
  • 创建了问题 11月8日

悬赏问题

  • ¥15 扩散模型sd.webui使用时报错“Nonetype”
  • ¥15 stm32流水灯+呼吸灯+外部中断按键
  • ¥15 将二维数组,按照假设的规定,如0/1/0 == "4",把对应列位置写成一个字符并打印输出该字符
  • ¥15 NX MCD仿真与博途通讯不了啥情况
  • ¥15 win11家庭中文版安装docker遇到Hyper-V启用失败解决办法整理
  • ¥15 gradio的web端页面格式不对的问题
  • ¥15 求大家看看Nonce如何配置
  • ¥15 Matlab怎么求解含参的二重积分?
  • ¥15 苹果手机突然连不上wifi了?
  • ¥15 cgictest.cgi文件无法访问