删除重复csv或者neo4j不导入重复节点

我现在有爬好数据的csv文件,需要导入neo4j形成节点。
但是这csv中有些数据是一样的(即形成的节点一模一样)

现在需要不导入重复的,或者导入后在neo4j中删除重复节点,如何做?

3个回答

Neo.TransientError.General.OutOfMemoryError: There is not enough memory to perform the current task. Please try increasing 'dbms.memory.heap.max_size' in the neo4j configuration (normally in 'conf/neo4j.conf' or, if you you are using Neo4j Desktop, found through the user interface) or if you are running an embedded installation increase the heap by using '-Xmx' command line flag, and then restart the database.

删去节点不就好了,直接set()

内存不足,修改配置文件中的max_size即可。默认max_size是512M,如果删除节点关系数超过110w。就会出现内存不足的情况。
最好csv文件中就去重。

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
mysql数据导入neo4j并创建关系,求大神
1.数据库的mysql,数据格式如下: ![图片说明](https://img-ask.csdn.net/upload/201906/03/1559529919_109624.png) 利用load csv 命令怎样导入到neo4j并创建关系,或者大神有什么其他办法也可以
python 向neo4j导入大量数据
我的实体和关系csv文件都是按照标准生成的,为什么关系数据库总是导入不进去?csv文件我已经放在import文件夹中了。![图片说明](https://img-ask.csdn.net/upload/201912/02/1575219314_505951.png)![图片说明](https://img-ask.csdn.net/upload/201912/02/1575219324_603451.png)![图片说明](https://img-ask.csdn.net/upload/201912/02/1575219333_493265.png)![图片说明](https://img-ask.csdn.net/upload/201912/02/1575219343_642598.png)
CSV文件导入SQL SERVER
使用数据库SQL SERVER 因为CSV文件包含多个CSV小文件,格式如下: NAME GENTLE TIME ATTR1 ATTR2 K F 0918 123 159 NAME GENTLE TIME ATTR1 ATTR2 K M 0919 135 246 NAME HEIGHT TIME ATTR3 ATTR4 ATTR5 J 165 0918 159 556 456 J 170 0919 856 735 895 可以看到NAME那一行是下面数据的意义,而且把不同NAME的数据分割开了 我想根据不同NAME,创建不同表,并根据NAME导入不同的表 而且,这种CSV文件有很多个需要同时导入 请问有没有不使用编程语言,只使用SQL或CMD(或shell)的办法,导入SQL SERVER数据库 如果能提供源码,最好了 如果不行,烦请提供可行方案(函数接口,如BULK INSERT重要参数的设置等) 因为要的着急,所以请理论党绕行。如有得罪请多包涵,但也请理解心情。 非常感谢!
怎么以java代码的方式,直接将csv或者json导入到mongodb里面。
现在有个问题,就是我需要别人传给我数据,而这个数据量也是挺大的,现在实现的逻辑是提供个接口,不断轮询的去调,我这边是mongodbTemplate不断的去保存。 但我总感觉,大数据量的情况下,这种方式好low,查询了许多资料,得知mongodb是支持以csv或json格式直接上传到库的,但都是命令行的形式。 所以求助大家,怎么以java代码的方式,直接将csv或者json导入到mongodb里面。 另外一点就是,mongodb的import不是java读取一行然后解析类型在处理成对象,再去保存,那样和调接口没啥区别,还不如直接调接口,我想的是直接导入csv文件,利用的是mongodb的特性,只要按照格式准备数据就可以了,所以各位大神帮忙看看?万分感谢
csv文件java的导入与导出
如何把csv文件的数据从一个文件导入另一个文件,java实现?
关于,mongodb 导入csv 文件
csv文件比较大,数据库字段很多,他的前四行是说明性的东西,请问如何从第4行开始导入数据。
sql 无法导入csv 有哪位遇到过吗
MySQL8.0 workbench 无法导入csv 源文件已更新为utf-8的csv,但是还是没有办法导入 有哪位大神遇到过这种情吗 ![图片说明](https://img-ask.csdn.net/upload/201908/29/1567071992_515076.png)![图片说明](https://img-ask.csdn.net/upload/201908/29/1567072172_311497.png)
登陆之后导入CSV文件到DGV后,下次用同样的用户登录DGV上会显示上一次导入的CSV
这个功能应该怎么做,我不知道我导入的CSV应该怎么保存让他下一次还会显示出来,用什么东西保存?我导入csv是不经过数据库的,我想让他保留上一次用户的csv文件应该也不会用到数据库吧,我该怎么做?
c#怎么在一个dgv中导入两张csv
两个csv里面的表格格式是一样的,导入第一张到dgv中,再将第二张导入,也就是将两张的内容在一个dgv中显示,我能做到将一个csv导入dgv中,但是再导入一张会覆盖原有的(dgv.datasource=data),不知道怎么样将两个csv的表格在dgv中连接起来,求大神解惑!!
需要导入Oracle的CSV文件有问题
**两个CSV文件,每个大概不到1万行数据,每个文件对应的表大概30的字段。 用PLSQL导入发现,30个字段只识别成了两个。** ![图片说明](https://img-ask.csdn.net/upload/201705/05/1493973853_841728.jpg) **于是用EXCEL打开CSV文件看,不知道是不是自动换行的锅** ![图片说明](https://img-ask.csdn.net/upload/201705/05/1493973875_128431.jpg) **把自动换行去掉,另存为txt或者csv文件,打开看,原来在一个单元格的多行变成了多行** ![图片说明](https://img-ask.csdn.net/upload/201705/05/1493974241_549959.jpg) **保存为XLS格式,复制到PLSQL界面也试过,一直无响应状态** **不知道还能有什么办法将这数据正确导入**
MVC4怎么实现导入csv文件?
我的前台是这样写的@Html.ActionLink("导入数据", "import"); 如何在后台通过这个import()方法实现导入csv文件呢?
Workbench导入CSV 不显示表的内容
用Workbench导入CSV 不显示表的内容 先后尝试了两个已有的表格进行导入(两个表格数据量一大一小),都显示导入0条记录,执行也显示无数据 ![图片说明](https://img-ask.csdn.net/upload/201901/21/1548041534_879313.png) ![图片说明](https://img-ask.csdn.net/upload/201901/21/1548041559_885070.png) ![图片说明](https://img-ask.csdn.net/upload/201901/21/1548041577_227988.png) ![图片说明](https://img-ask.csdn.net/upload/201901/21/1548041602_163587.png) 又自己创建一个表再导入,可以显示内容 ![图片说明](https://img-ask.csdn.net/upload/201901/21/1548041674_395009.png) 不清楚是因为什么原因 是现有表数据太多? 还是格式的问题? 还是workbench的问题?
vs2010使用c#制作windows窗体如何将csv文件导入到DaDataGridView显示
希望能有大手来教下 新手 我大概的想法是先用openfile找到我们要的csv文件 然后将文件导入一个datatable中 然后再将数据弄到dadatagrdview中 当然希望能有代码 这种导入是不需要经过数据库的吧
CSV文件导入mysql,长整型报错
CSV文件的第一列是序号,可能有7-8位长,只一个长整型的数据。用 sqlyog工具导入CSV 文件时,这行序号报错,Incorrect integer value:'1060165' for column 'id' at row 2
mysql workbench8.0 导入csv文件中出现报错ascil”编解码器无法解码位置为O
mysql workbench 导入csv文件中出现报错:错误未处理的异常:“ascil”编解码器无法解码位置为O:序号不在范围内的字节Oxe6 (128)?
请问怎样将csv文件导入到sql表中的最后几列?
要将csv文件中的数据导入一个sql表中,但是sql表的字段数要多,只把csv文件中的数据 导入到sql表中的最后几列,请问这个可以实现吗?
使用MS SQL Server自带导入工具导入CSV文件,字段老是被截断,但后续用bulk insert又能一次性成功导入
在自己电脑上,我使用MS SQL Server 2014自带的导入导出工具往数据库导入CSV格式文件时,不管什么样的内容,一定会报错,提示某字段被截断!但我仔细查看源文件,被截断的字段长度根本不长啊!并且我还用EXCEL把CSV文件内容中的逗号都批量删除掉了,导入时仍然报错!但是我使用bulk insert导入,却瞬间导进去了!极度郁闷,每次都得使用SQL Server自带的导入工具导入CSV文件,然后报错(这时已经在数据库中创立了表,但是因为报错,表里没数据),再用bulk insert把源数据导入到这个表里。 各位大神能告诉我这是什么原因吗? ![图片说明](https://img-ask.csdn.net/upload/201905/28/1559053109_598348.jpg) ![图片说明](https://img-ask.csdn.net/upload/201905/28/1559053123_965649.jpg)
有什么好的方法把CSV格式导入到SQL数据库中?有代码更加好,或者指教思路也可以,感谢啦!
有什么好的方法把CSV格式导入到SQL数据库中?有VB.NET或者C#代码更加好,或者指教思路也可以,感谢啦!
centos7 elasticsearch 使用导入logstash导入csv文件,一直提示导入成功,但实际并没有导入分片
以下是test.config ``` input{ file{ path=>["/home/test.csv"] start_position => "beginning" } } filter{ csv{ separator => "," columns => ["CDR.CallID","CDR.TraceID","CDR.MMEGroupID","CDR.MMECode","CDR.eNodeBID","CDR.sTMSI","CDR.MmeUeS1APID","CDR.eNBUeS1APID","CDR.StartTime","CDR.EndTime"] } mutate{ convert =>{ "CDR.CallID" => "integer" "CDR.TraceID" => "string" "CDR.MMEGroupID" => "string" "CDR.MMECode" => "string" "CDR.eNodeBID" => "integer" "CDR.sTMSI" => "integer" "CDR.MmeUeS1APID" => "integer" "CDR.eNBUeS1APID" => "integer" "CDR.StartTime" => "string" "CDR.StartTime" => "string" } } } output{ elasticsearch{ hosts => ["localhost:9200"] index => "test2" document_type => "test2" } } ``` 执行: ``` ./bin/logstash -f test.json ``` ![图片说明](https://img-ask.csdn.net/upload/201910/08/1570500319_842962.png) 结果: ![图片说明](https://img-ask.csdn.net/upload/201910/08/1570500486_679341.png) 博客都说是配置文件问题,我自个手动编写config文件,问题还是存在!!!
Java学习的正确打开方式
在博主认为,对于入门级学习java的最佳学习方法莫过于视频+博客+书籍+总结,前三者博主将淋漓尽致地挥毫于这篇博客文章中,至于总结在于个人,实际上越到后面你会发现学习的最好方式就是阅读参考官方文档其次就是国内的书籍,博客次之,这又是一个层次了,这里暂时不提后面再谈。博主将为各位入门java保驾护航,各位只管冲鸭!!!上天是公平的,只要不辜负时间,时间自然不会辜负你。 何谓学习?博主所理解的学习,它是一个过程,是一个不断累积、不断沉淀、不断总结、善于传达自己的个人见解以及乐于分享的过程。
程序员必须掌握的核心算法有哪些?
由于我之前一直强调数据结构以及算法学习的重要性,所以就有一些读者经常问我,数据结构与算法应该要学习到哪个程度呢?,说实话,这个问题我不知道要怎么回答你,主要取决于你想学习到哪些程度,不过针对这个问题,我稍微总结一下我学过的算法知识点,以及我觉得值得学习的算法。这些算法与数据结构的学习大多数是零散的,并没有一本把他们全部覆盖的书籍。下面是我觉得值得学习的一些算法以及数据结构,当然,我也会整理一些看过...
有哪些让程序员受益终生的建议
从业五年多,辗转两个大厂,出过书,创过业,从技术小白成长为基层管理,联合几个业内大牛回答下这个问题,希望能帮到大家,记得帮我点赞哦。 敲黑板!!!读了这篇文章,你将知道如何才能进大厂,如何实现财务自由,如何在工作中游刃有余,这篇文章很长,但绝对是精品,记得帮我点赞哦!!!! 一腔肺腑之言,能看进去多少,就看你自己了!!! 目录: 在校生篇: 为什么要尽量进大厂? 如何选择语言及方...
大学四年自学走来,这些私藏的实用工具/学习网站我贡献出来了
大学四年,看课本是不可能一直看课本的了,对于学习,特别是自学,善于搜索网上的一些资源来辅助,还是非常有必要的,下面我就把这几年私藏的各种资源,网站贡献出来给你们。主要有:电子书搜索、实用工具、在线视频学习网站、非视频学习网站、软件下载、面试/求职必备网站。 注意:文中提到的所有资源,文末我都给你整理好了,你们只管拿去,如果觉得不错,转发、分享就是最大的支持了。 一、电子书搜索 对于大部分程序员...
linux系列之常用运维命令整理笔录
本博客记录工作中需要的linux运维命令,大学时候开始接触linux,会一些基本操作,可是都没有整理起来,加上是做开发,不做运维,有些命令忘记了,所以现在整理成博客,当然vi,文件操作等就不介绍了,慢慢积累一些其它拓展的命令,博客不定时更新 free -m 其中:m表示兆,也可以用g,注意都要小写 Men:表示物理内存统计 total:表示物理内存总数(total=used+free) use...
比特币原理详解
一、什么是比特币 比特币是一种电子货币,是一种基于密码学的货币,在2008年11月1日由中本聪发表比特币白皮书,文中提出了一种去中心化的电子记账系统,我们平时的电子现金是银行来记账,因为银行的背后是国家信用。去中心化电子记账系统是参与者共同记账。比特币可以防止主权危机、信用风险。其好处不多做赘述,这一层面介绍的文章很多,本文主要从更深层的技术原理角度进行介绍。 二、问题引入 假设现有4个人...
程序员接私活怎样防止做完了不给钱?
首先跟大家说明一点,我们做 IT 类的外包开发,是非标品开发,所以很有可能在开发过程中会有这样那样的需求修改,而这种需求修改很容易造成扯皮,进而影响到费用支付,甚至出现做完了项目收不到钱的情况。 那么,怎么保证自己的薪酬安全呢? 我们在开工前,一定要做好一些证据方面的准备(也就是“讨薪”的理论依据),这其中最重要的就是需求文档和验收标准。一定要让需求方提供这两个文档资料作为开发的基础。之后开发...
网页实现一个简单的音乐播放器(大佬别看。(⊙﹏⊙))
今天闲着无事,就想写点东西。然后听了下歌,就打算写个播放器。 于是乎用h5 audio的加上js简单的播放器完工了。 演示地点演示 html代码如下` music 这个年纪 七月的风 音乐 ` 然后就是css`*{ margin: 0; padding: 0; text-decoration: none; list-...
Python十大装B语法
Python 是一种代表简单思想的语言,其语法相对简单,很容易上手。不过,如果就此小视 Python 语法的精妙和深邃,那就大错特错了。本文精心筛选了最能展现 Python 语法之精妙的十个知识点,并附上详细的实例代码。如能在实战中融会贯通、灵活使用,必将使代码更为精炼、高效,同时也会极大提升代码B格,使之看上去更老练,读起来更优雅。
数据库优化 - SQL优化
以实际SQL入手,带你一步一步走上SQL优化之路!
2019年11月中国大陆编程语言排行榜
2019年11月2日,我统计了某招聘网站,获得有效程序员招聘数据9万条。针对招聘信息,提取编程语言关键字,并统计如下: 编程语言比例 rank pl_ percentage 1 java 33.62% 2 cpp 16.42% 3 c_sharp 12.82% 4 javascript 12.31% 5 python 7.93% 6 go 7.25% 7 p...
通俗易懂地给女朋友讲:线程池的内部原理
餐盘在灯光的照耀下格外晶莹洁白,女朋友拿起红酒杯轻轻地抿了一小口,对我说:“经常听你说线程池,到底线程池到底是个什么原理?”
《奇巧淫技》系列-python!!每天早上八点自动发送天气预报邮件到QQ邮箱
将代码部署服务器,每日早上定时获取到天气数据,并发送到邮箱。 也可以说是一个小型人工智障。 知识可以运用在不同地方,不一定非是天气预报。
经典算法(5)杨辉三角
杨辉三角 是经典算法,这篇博客对它的算法思想进行了讲解,并有完整的代码实现。
英特尔不为人知的 B 面
从 PC 时代至今,众人只知在 CPU、GPU、XPU、制程、工艺等战场中,英特尔在与同行硬件芯片制造商们的竞争中杀出重围,且在不断的成长进化中,成为全球知名的半导体公司。殊不知,在「刚硬」的背后,英特尔「柔性」的软件早已经做到了全方位的支持与支撑,并持续发挥独特的生态价值,推动产业合作共赢。 而对于这一不知人知的 B 面,很多人将其称之为英特尔隐形的翅膀,虽低调,但是影响力却不容小觑。 那么,在...
腾讯算法面试题:64匹马8个跑道需要多少轮才能选出最快的四匹?
昨天,有网友私信我,说去阿里面试,彻底的被打击到了。问了为什么网上大量使用ThreadLocal的源码都会加上private static?他被难住了,因为他从来都没有考虑过这个问题。无独有偶,今天笔者又发现有网友吐槽了一道腾讯的面试题,我们一起来看看。 腾讯算法面试题:64匹马8个跑道需要多少轮才能选出最快的四匹? 在互联网职场论坛,一名程序员发帖求助到。二面腾讯,其中一个算法题:64匹...
面试官:你连RESTful都不知道我怎么敢要你?
干货,2019 RESTful最贱实践
为啥国人偏爱Mybatis,而老外喜欢Hibernate/JPA呢?
关于SQL和ORM的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行了一番讨论,感触还是有一些,于是就有了今天这篇文。 声明:本文不会下关于Mybatis和JPA两个持久层框架哪个更好这样的结论。只是摆事实,讲道理,所以,请各位看官勿喷。 一、事件起因 关于Mybatis和JPA孰优孰劣的问题,争论已经很多年了。一直也没有结论,毕竟每个人的喜好和习惯是大不相同的。我也看...
白话阿里巴巴Java开发手册高级篇
不久前,阿里巴巴发布了《阿里巴巴Java开发手册》,总结了阿里巴巴内部实际项目开发过程中开发人员应该遵守的研发流程规范,这些流程规范在一定程度上能够保证最终的项目交付质量,通过在时间中总结模式,并推广给广大开发人员,来避免研发人员在实践中容易犯的错误,确保最终在大规模协作的项目中达成既定目标。 无独有偶,笔者去年在公司里负责升级和制定研发流程、设计模板、设计标准、代码标准等规范,并在实际工作中进行...
SQL-小白最佳入门sql查询一
不要偷偷的查询我的个人资料,即使你再喜欢我,也不要这样,真的不好;
redis分布式锁,面试官请随便问,我都会
文章有点长并且绕,先来个图片缓冲下! 前言 现在的业务场景越来越复杂,使用的架构也就越来越复杂,分布式、高并发已经是业务要求的常态。像腾讯系的不少服务,还有CDN优化、异地多备份等处理。 说到分布式,就必然涉及到分布式锁的概念,如何保证不同机器不同线程的分布式锁同步呢? 实现要点 互斥性,同一时刻,智能有一个客户端持有锁。 防止死锁发生,如果持有锁的客户端崩溃没有主动释放锁,也要保证锁可以正常释...
项目中的if else太多了,该怎么重构?
介绍 最近跟着公司的大佬开发了一款IM系统,类似QQ和微信哈,就是聊天软件。我们有一部分业务逻辑是这样的 if (msgType = "文本") { // dosomething } else if(msgType = "图片") { // doshomething } else if(msgType = "视频") { // doshomething } else { // doshom...
Nginx 原理和架构
Nginx 是一个免费的,开源的,高性能的 HTTP 服务器和反向代理,以及 IMAP / POP3 代理服务器。Nginx 以其高性能,稳定性,丰富的功能,简单的配置和低资源消耗而闻名。 Nginx 的整体架构 Nginx 里有一个 master 进程和多个 worker 进程。master 进程并不处理网络请求,主要负责调度工作进程:加载配置、启动工作进程及非停升级。worker 进程负责处...
Python 编程开发 实用经验和技巧
Python是一门很灵活的语言,也有很多实用的方法,有时候实现一个功能可以用多种方法实现,我这里总结了一些常用的方法和技巧,包括小数保留指定位小数、判断变量的数据类型、类方法@classmethod、制表符中文对齐、遍历字典、datetime.timedelta的使用等,会持续更新......
YouTube排名第一的励志英文演讲《Dream(梦想)》
Idon’t know what that dream is that you have, I don't care how disappointing it might have been as you've been working toward that dream,but that dream that you’re holding in your mind, that it’s po...
“狗屁不通文章生成器”登顶GitHub热榜,分分钟写出万字形式主义大作
一、垃圾文字生成器介绍 最近在浏览GitHub的时候,发现了这样一个骨骼清奇的雷人项目,而且热度还特别高。 项目中文名:狗屁不通文章生成器 项目英文名:BullshitGenerator 根据作者的介绍,他是偶尔需要一些中文文字用于GUI开发时测试文本渲染,因此开发了这个废话生成器。但由于生成的废话实在是太过富于哲理,所以最近已经被小伙伴们给玩坏了。 他的文风可能是这样的: 你发现,...
程序员:我终于知道post和get的区别
是一个老生常谈的话题,然而随着不断的学习,对于以前的认识有很多误区,所以还是需要不断地总结的,学而时习之,不亦说乎
《程序人生》系列-这个程序员只用了20行代码就拿了冠军
你知道的越多,你不知道的越多 点赞再看,养成习惯GitHub上已经开源https://github.com/JavaFamily,有一线大厂面试点脑图,欢迎Star和完善 前言 这一期不算《吊打面试官》系列的,所有没前言我直接开始。 絮叨 本来应该是没有这期的,看过我上期的小伙伴应该是知道的嘛,双十一比较忙嘛,要值班又要去帮忙拍摄年会的视频素材,还得搞个程序员一天的Vlog,还要写BU...
加快推动区块链技术和产业创新发展,2019可信区块链峰会在京召开
11月8日,由中国信息通信研究院、中国通信标准化协会、中国互联网协会、可信区块链推进计划联合主办,科技行者协办的2019可信区块链峰会将在北京悠唐皇冠假日酒店开幕。   区块链技术被认为是继蒸汽机、电力、互联网之后,下一代颠覆性的核心技术。如果说蒸汽机释放了人类的生产力,电力解决了人类基本的生活需求,互联网彻底改变了信息传递的方式,区块链作为构造信任的技术有重要的价值。   1...
Java世界最常用的工具类库
Apache Commons Apache Commons有很多子项目 Google Guava 参考博客
相关热词 c#选择结构应用基本算法 c# 收到udp包后回包 c#oracle 头文件 c# 序列化对象 自定义 c# tcp 心跳 c# ice连接服务端 c# md5 解密 c# 文字导航控件 c#注册dll文件 c#安装.net
立即提问