python像普通软件一样,打开文件夹导入鼠标选定的文件进行处理 5C

感觉python导入数据文件太过呆板,用来做数据分析不太方便,
希望可以打开一个文件夹,导入需要的数据文件

2个回答

弹出打开文件对话框选择文件么?
http://blog.csdn.net/u010359532/article/details/44784731

你想通过python从文件中读取文本或数据。

一.最方便的方法是一次性读取文件中的所有内容并放置到一个大字符串中:

  1. all_the_text = open('thefile.txt').read( ) # 文本文件中的所有文本

  2. all_the_data = open('abinfile','rb').read( ) # 二进制文件中的所有数据

为了安全起见,最好还是给打开的文件对象指定一个名字,这样在完成操作之后可以迅速关闭文件,防止一些无用的文件对象占用内存。举个例子,对文本文件读取:

  1. file_object = open('thefile.txt')

  2. try:

  3.  all_the_text = file_object.read( )  
    
  4. finally:

  5.  file_object.close( ) 
    

不一定要在这里用Try/finally语句,但是用了效果更好,因为它可以保证文件对象被关闭,即使在读取中发生了严重错误。

二.最简单、最快,也最具Python风格的方法是逐行读取文本文件内容,并将读取的数据放置到一个字符串列表中:

  1. list_of_all_the_lines = file_object.readlines( )

这样读出的每行文本末尾都带有"\n"符号;如果你不想这样,还有另一个替代的办法,比如:

  1. list_of_all_the_lines = file_object.read( ).splitlines( )

  2. list_of_all_the_lines = file_object.read( ).split('\n')

  3. list_of_all_the_lines = [L.rstrip('\n') for L in file_object]

最简单最快的逐行处理文本文件的方法是,用一个简单的for循环语句:

  1. for line in file_object:

  2.   process line 
    

这种方法同样会在每行末尾留下"\n"符号;可以在for循环的主体部分加一句:

  1. lineline = line.rstrip('\n')

或者,你想去除每行的末尾的空白符(不只是'\n'\),常见的办法是:

  1. lineline = line.rstrip( )

三.讨论

除非要读取的文件非常巨大,不然一次性读出所有内容放进内存并进一步处理是最快和最方便的办法。内建函数open创建了一个Python的文件对象(另外,也可以通过调用内建类型file创建文件对象)。你对该对象调用read方法将读出所有内容(无论是文本还是二进制数据),并放入一个大字符串中。如果内容是文本,可以选择用split方法或者更专用的splitlines将其切分成一个行列表。由于切分字符串到单行是很常见的需求,还可以直接对文件对象调用readlines,进行更方便更快速的处理。

可以直接对文件对象应用循环语句,或者将它传递给一个需要可迭代对象的处理者,比如list或者max。当它被当做一个可迭代对象处理时,一个被打开并被读取的文件对象中的每一个文本行都变成了迭代子项(因此,这也只适用于文本文件)。这种逐行迭代的处理方式很节省内存资源,速度也不错。

在UNIX或者类UNIX系统中,比如Linux,Mac OS X,或者其他BSD变种,文本文件和二进制文件其实并没有什么区别。在Windows和老的Macintosh系统中,换行符不是标准的 '\n',而分别是 '\r\n' 和 '\r'。Python会帮助你把这些换行符转化成 '\n'。这意味着当你打开二进制文件时,需要明确告诉Python,这样它就不会做任何转化。为了达到这个目的,必须传递 'rb' 给open的第二个参数。在类UNLX平台上,这么做也不会有什么坏处,而且总是区分文本文件和二进制文件是一个好习惯,当然在那些平台上这并不是强制性的要求。不过这些好习惯会让你的程序具有更好的可读性,也更易于理解,同时还能具有更好的平台兼容性。

如果不确定某文本文件会用什么样的换行符,可以将open的第二个参数设定为 'rU',指定通用换行符转化。这让你可以自由地在Windows、UNIX(包括Mac OS X),以及其他的老Macintosh平台上交换文件,完全不用担心任何问题:无论你的代码在什么平台上运行,各种换行符都被映射成 '\n'。

可以对open函数产生的文件对象直接调用read方法,如解决方案中给出的第一个代码片段所示。当你这么做的时候,你在完成读取的同时,也失去了对那个文件对象的引用。在实践中,Python注意到了这种当场即时失去引用的情况,它会迅速关闭该文件。然而,更好的办法仍然是给open产生的结果指定一个名字,这样当你完成了处理,可以显式地自行关闭该文件。这能够确保该文件处于被打开状态的时间尽量的短,即使是在Jython,IronPython或其他变种Python平台上(这些平台的高级垃圾回收机制可能会推迟自动回收,不像现在的基于C的Python平台,CPython会立刻执行回收)。为了确保文件对象即使在处理过程发生错误的情况下仍能够正确关闭,应该使用try/finally语句,这是一种稳健而严谨的处理方式。

  1. file_object = open('thefile.txt')

  2. try:

  3.   for line in file_object:  
    
  4.          process line  
    
  5. finally:

  6.   file_object.close( ) 
    

注意,不要把对open的调用放入到try/finally语句的try子句中(这是初学者很常见的错误)。如果在打开文件的时候就发生了错误,那就没有什么东西需要关闭,而且,也没有什么实质性的东西绑定到了file_object这个名字上,当然也就不应该调用file_object.close()。

如果选择一次读取文件的一小部分,而不是全部,方式就有点不同了。下面给出一个例子,一次读取一个二进制文件的100个字节,一直读到文件末尾:

  1. file_object = open('abinfile', 'rb')

  2. try:

  3.   while True:  
    
  4.         chunk = file_object.read(100)  
    
  5.         if not chunk:  
    
  6.               break  
    
  7.         do_something_with(chunk)  
    
  8. finally:

  9.   file_object.close( ) 
    

给read方法传入一个参数N,确保了read方法只读取下N个字节(或更少,如果读取位置已经很接近文件末尾的话)。当抵达文件末尾时,read返回空字符串。复杂的循环最好被封装成可复用的生成器(generator)。对于这个例子,我们只能将其逻辑的一部分进行封装,这是因为生成器(generator)的yield关键字不被允许出现在try/finally语句的try子句中。如果要抛弃try/finally语句对文件关闭的保护,我们可以这么做:

  1. def read_file_by_chunks(filename, chunksize=100):

  2.   file_object = open(filename, 'rb')  
    
  3.   while True:  
    
  4.         chunk = file_object.read(chunksize)  
    
  5.         if not chunk:  
    
  6.               break  
    
  7.         yield chunk  
    
  8.   file_object.close( ) 
    

一旦read_file_by_chunks生成器完成,以固定长度读取和处理二进制文件的代码就可以写得极其简单:

  1. for chunk in read_file_by_chunks('abinfile'):

  2.   do_something_with(chunk) 
    

逐行读取文本文件的任务更为常见。只需对文件对象应用循环语句,如下:

  1. for line in open('thefile.txt', 'rU'):

  2.   do_something_with(line) 
    

为了100%确保完成操作之后没有无用的已打开的文件对象存在,可以将上述代码修改得更加严密稳固:

  1. file_object = open('thefile.txt', 'rU'):

  2. try:

  3.   for line in file_object:  
    
  4.          do_something_with(line)  
    
  5. finally:

  6.   file_object.close( ) 
    
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
python如何操作HDFS读取Mapfile 文件
-
python怎样把文件夹中的多个中文txt文件,处理成一个.json文件?
-
python2 中tkinter 打开文件 中文乱码
-
python编写并生成可拖入文件即可触发运行的exe文件
-
Python中如何导入一个外部的py文件?
-
请问Python已读取的CSV文件如何去掉Index值?
-
RIDE的testcase edit界面显示异常/空白
-
如何按照文件名字对应关系,批处理文件
-
Python语言,计算数组的平方差的计算方法是什么
-
python如何实现两个文件夹中有相同字段的栅格数据的批量地图代数计算?
-
这是一个关于PYTHON的变量问题
-
我修复了移动硬盘。然后发现移动硬盘上面的python程序无法写入,报错PermissionError [Errno 13],之前是没有报错的,同样的程序。
-
Python遍历文件夹的文件提取关键信息到新的表格
-
python 输出文件后关闭不了?
-
python中import的问题
-
Python三个数字按照从大到小的顺序排列,在线等回答
-
Python 发送带附件的邮件,有些文件能发送有些文件发送不了?
-
在python的for语句下,i为什么会一直是1呢?
-
python新手学习GUI框架wx,没有出现窗口
-
记一道字节跳动的算法面试题
点击蓝色“五分钟学算法”关注我哟加个“星标”,天天中午 12:15,一起学算法作者 | 帅地来源公众号 | 苦逼的码农前几天有个朋友去面试字节跳动,面试官问了他一道链表相...
程序员真是太太太太太有趣了!!!
网络上虽然已经有了很多关于程序员的话题,但大部分人对这个群体还是很陌生。我们在谈论程序员的时候,究竟该聊些什么呢?各位程序员大佬们,请让我听到你们的声音!不管你是前端开发...
史上最详细的IDEA优雅整合Maven+SSM框架(详细思路+附带源码)
网上很多整合SSM博客文章并不能让初探ssm的同学思路完全的清晰,可以试着关掉整合教程,摇两下头骨,哈一大口气,就在万事具备的时候,开整,这个时候你可能思路全无 ~中招了咩~ ,还有一些同学依旧在使用eclipse或者Myeclipse开发,我想对这些朋友说IDEA 的编译速度很快,人生苦短,来不及解释了,直接上手idea吧。这篇文章每一步搭建过程都测试过了,应该不会有什么差错。本文章还有个比较优秀的特点,就是idea的使用,基本上关于idea的操作都算是比较详细的,所以不用太担心不会撸idea!最后,本文
吃人的那些 Java 名词:对象、引用、堆、栈
作为一个有着 8 年 Java 编程经验的 IT 老兵,说起来很惭愧,我被 Java 当中的四五个名词一直困扰着:**对象、引用、堆、栈、堆栈**(栈可同堆栈,因此是四个名词,也是五个名词)。每次我看到这几个名词,都隐隐约约觉得自己在被一只无形的大口慢慢地吞噬,只剩下满地的衣服碎屑(为什么不是骨头,因为骨头也好吃)。
LeetCode解题汇总目录
此篇为LeetCode刷题的汇总目录,方便大家查找,一起刷题,一起PK交流! 已解题目 考点 LeetCode 1. 两数之和(哈希) LeetCode 2. 两数相加(单链表反转) LeetCode 9. 回文数 LeetCode 11. 盛最多水的容器(双指针) LeetCode 15. 三数之和 LeetCode 17. 电话号码的字母组合(回溯...
我花了一夜用数据结构给女朋友写个H5走迷宫游戏
起因 又到深夜了,我按照以往在csdn和公众号写着数据结构!这占用了我大量的时间!我的超越妹妹严重缺乏陪伴而 怨气满满! 而女朋友时常埋怨,认为数据结构这么抽象难懂的东西没啥作用,常会问道:天天写这玩意,有啥作用。而我答道:能干事情多了,比如写个迷宫小游戏啥的! 当我码完字准备睡觉时:写不好别睡觉! 分析 如果用数据结构与算法造出东西来呢? ...
不识 Pandas,纵是老手也枉然?
作者 |周志鹏 责编 | 郭 芮 这段时间和一些做数据分析的同学闲聊,我发现数据分析技能入门阶段存在一个普遍性的问题,很多凭着兴趣入坑的同学,都能够很快熟悉Python基础语法,然后不约而同的一头扎进《利用Python进行数据分析》这本经典之中,硬着头皮啃完之后,好像自己什么都会了一点,然而实际操作起来既不知从何操起,又漏洞百出。 至于原因嘛,理解不够,实践不够是两条老牌的拦路...
接班马云的为何是张勇?
上海人、职业经理人、CFO 背景,集齐马云三大不喜欢的张勇怎么就成了阿里接班人? 作者|王琳 本文经授权转载自燃财经(ID:rancaijing) 9月10日,张勇转正了,他由阿里巴巴董事局候任主席正式成为阿里巴巴董事局主席,这也意味着阿里巴巴将正式开启“逍遥子时代”。 从2015年接任CEO开始,张勇已经将阿里巴巴股价拉升了超过200%。但和马云强大的个人光环比,张勇显得尤其...
14 个实用的数据库设计技巧
点击上方“后端技术精选”,选择“置顶公众号”技术文章第一时间送达!作者:echozhjuejin.im/post/5d5b4c6951882569eb570958原始单据...
我在快手认识了 4 位工程师,看到了快速发展的公司和员工如何彼此成就!
作者 | 胡巍巍 出品 | CSDN(ID:CSDNnews) 从西二旗地铁站B口出来,步行700多米可以看到一个工业建筑风格的院子。这个独立的院子和后厂村各大互联网公司的高楼林立有些不同。 院子里有7栋6层高的楼,几栋楼之间打通,可以从A栋自由穿行到F栋。这里就是快手总部。这个园区可以容纳6000多名员工,目前40%以上是研发人员。 这些研发人员维护着快手这款日活超过2亿的ap...
让程序员崩溃的瞬间(非程序员勿入)
今天给大家带来点快乐,程序员才能看懂。 来源:https://zhuanlan.zhihu.com/p/47066521 1. 公司实习生找 Bug 2.在调试时,将断点设置在错误的位置 3.当我有一个很棒的调试想法时 4.偶然间看到自己多年前写的代码 5.当我第一次启动我的单元测试时 ...
用Python分析2000款避孕套,得出这些有趣的结论
到现在为止,我们的淘宝教程已经写到了第四篇,前三篇分别是: 第一篇:Python模拟登录淘宝,详细讲解如何使用requests库登录淘宝pc端。 第二篇:淘宝自动登录2.0,新增Cookies序列化,教大家如何将cookies保存起来。 第三篇:Python爬取淘宝商品避孕套,教大家如何爬取淘宝pc端商品信息。 今天,我们来看看淘宝系列的第四篇 我们在上一篇的时候已经将淘宝数据爬取下来了,...
Spring高级技术梳理
Spring高级技术梳理 序言正文SpringDate部分Spring全家桶之SpringData——预科阶段Spring全家桶之SpringData——Spring 整合Hibernate与Hibernate JpaSpring全家桶之SpringData——Spring Data JPASpring全家桶之SpringData——SpringData RedisSpringBoot部分Sp...
如何在Windows中开启"上帝模式"
原文链接 : https://mp.weixin.qq.com/s?__biz=MzIwMjE1MjMyMw==&mid=2650202982&idx=1&sn=2c6c609ce06db1cee81abf2ba797be1b&chksm=8ee1438ab996ca9c2d0cd0f76426e92faa835beef20ae21b537c0867ec2773be...
Docker 零基础从入门到使用
诺!这只可爱的小鲸鱼就是docker了! Docker 是什么? Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的镜像中,然后发布到任何流行的 Linux 或 Windows 机器上( 摘自百度 )。 Docker 能干什么? 在讲 Docker 能干什么之前,我们不妨先看看没有 Docker 和有Docker分别是个什么样子的? 场景一 某公司需要开发...
再见 Docker,是时候拥抱下一代容器工具了
什么是 Linux 容器?Linux 容器是由 Linux 内核所提供的具有特定隔离功能的进程,Linux 容器技术能够让你对应用及其整个运行时环境(包括全部所需文件)一...
不足20行 python 代码,高效实现 k-means 均值聚类算法
关于 k-means 均值聚类算法的原理介绍、实现代码,网上有很多,但运行效率似乎都有点问题。今天稍微有点空闲,写了一个不足20行的 k-means 均值聚类算法,1万个样本平均耗时20毫秒(10次均值)。同样的数据样本,网上流行的算法平均耗时3000毫秒(10次均值)。差距竟然达百倍以上,令我深感意外,不由得再次向 numpy 献上膝盖!
分享靠写代码赚钱的一些门路
作者 mezod,译者 josephchang10如今,通过自己的代码去赚钱变得越来越简单,不过对很多人来说依然还是很难,因为他们不知道有哪些门路。今天给大家分享一个精彩...
北漂程序员,扬帆起航的地方
随着耳畔传来“你看这碗又大又圆、你看这面又长又宽......碗大宽无影、像儿时的回忆......”听着挺带劲,于是看了一下手机,原来是吴亦凡的作品《大碗宽面》,随着入耳的旋律,脑子也不由自主的想起 10 年前,在平西府吃 5 块钱一大碗牛肉板面的情景。 平西府最有名的就是这个牌坊啦。记得每当有同事问起住哪里?都会自豪的说住在王府里;隔三差五也会邀请朋友去府上坐坐。其实打内心里讲,平西府是一个...
技术人员要拿百万年薪,必须要经历这9个段位
很多人都问,技术人员如何成长,每个阶段又是怎样的,如何才能走出当前的迷茫,实现自我的突破。所以我结合我自己10多年的从业经验,总结了技术人员成长的9个段位,希望对大家的职...
多线程编程是后台开发人员的基本功
这里先给大家分享一个小故事:在我刚开始参加工作的那年,公司安排我开发一款即时通讯软件(IM,类似于 QQ 聊天软件),在这之前我心里也知道如果多线程操作一个整型值是要加锁...
相关热词 c#怎么调用api接口 c# 调用mstsc c#扩展函数 c#向上转换向下转换 c#chart直方图叠加 c# 添加body样式 c# 调用接口 c#高德地图经纬度查询 c# 测试并发 c# 取操作系统