努力的小bai 2023-08-31 13:58 采纳率: 0%

已结题

Python excel多文件查询问题

项目背景：
一位萌萌哒测试，自学python，因为对比翻译太过耗费时间，希望可以节省点时间，希望各位多多帮助，感谢

需求描述：
因为软件比较复杂，人工对比翻译后的rc比较繁琐，所以想弄一个工具代替人工操作。

思路描述：
先将rc文件转换为txt文件，随后将中文rc文件的每行数据写入到一个表格excel1，将外文的rc文件每行数据写入到另一个表格excel2，并将两个表格合并，此时，这个表格中含有两列数据暂定名为，一列为中文rc文件中每一行的数据，另一列为外文rc文件中的每一行数据。然后对比这两个RC文件，因为包含部分相同的内容，所以需要把相同的内容去除。总体的翻译excel3表格中，中外文是对应的，类似如下图的样子，现在需要把处理后的两个RC文件生成的excel1、excel2表格内容，根据中文一行一行的在如下总体翻译表格excel3中搜索，然后再获取excel3右侧翻译后的俄语，将获取到的俄语再在excel2表格中的俄语列进行搜索，查看是否存在，若存在则证明RC文件翻译正确，若不存在，将不存在的中文记录在一个新的excel3表格中，后续人工核验。

需要解答的：
现在excel1和excel2均已完成数据处理，需要进行搜索比对了，没什么思路，希望能提供些思路

这个是excel1

这个是excel2

这个是excel3

希望能提供下思路、方法或者代码，万分感谢！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

14条回答默认最新

Leodong. 2023-08-31 14:16

关注

获得0.45元问题酬金

该回答通过自己思路及引用到GPTᴼᴾᴱᴺᴬᴵ搜索,得到内容具体如下：根据你的需求描述，你想要使用Python对两个Excel文件进行搜索和比对。以下是一个可能的思路和代码示例来实现你的需求：

导入所需的库：
```
import pandas as pd
```

读取 Excel 文件并获取数据：

excel1_data = pd.read_excel('excel1.xlsx')
excel2_data = pd.read_excel('excel2.xlsx')
excel3_data = pd.read_excel('excel3.xlsx')

请确保将 excel1.xlsx、excel2.xlsx 和 excel3.xlsx 替换为你的实际文件名和路径。

对比两个 RC 文件的中文和外文内容：
```
matched_data = pd.merge(excel1_data, excel2_data, on='中文列名', how='inner')
```
在上述代码中，将 中文列名 替换为你的 Excel 表中包含中文的列的列名。这将执行一个内连接操作，找到中文和外文列中的匹配项。

搜索并比对翻译后的俄语：

for index, row in matched_data.iterrows():
 chinese_text = row['中文列名']
 russian_text = row['俄语列名']
 result = excel3_data[excel3_data['中文列名'] == chinese_text]
 if not result.empty and russian_text in result['俄语列名'].values:
     print(f"中文：{chinese_text}，俄语：{russian_text}，匹配成功")
 else:
     print(f"中文：{chinese_text}，俄语：{russian_text}，匹配失败")

请将 '中文列名' 和 '俄语列名' 替换为实际的列名。在上述代码中，我们使用了 iterrows() 方法遍历每一行数据，并使用条件语句检查翻译后的俄语是否存在于 Excel3 中。

将不匹配的记录保存到新的 Excel 文件中：

mismatched_data = pd.DataFrame(columns=['中文列名', '俄语列名'])

for index, row in matched_data.iterrows():
    chinese_text = row['中文列名']
    russian_text = row['俄语列名']
    result = excel3_data[excel3_data['中文列名'] == chinese_text]
    if not result.empty and russian_text not in result['俄语列名'].values:
        mismatched_data = mismatched_data.append({'中文列名': chinese_text, '俄语列名': russian_text}, ignore_index=True)

mismatched_data.to_excel('mismatched_data.xlsx', index=False)

下面是一个完整的代码示例，包括以上提到的所有步骤：

import pandas as pd

# 读取 Excel 文件
excel1_data = pd.read_excel('excel1.xlsx')
excel2_data = pd.read_excel('excel2.xlsx')
excel3_data = pd.read_excel('excel3.xlsx')

# 对比两个 RC 文件的中文和外文内容
matched_data = pd.merge(excel1_data, excel2_data, on='中文列名', how='inner')

# 搜索并比对翻译后的俄语
for index, row in matched_data.iterrows():
    chinese_text = row['中文列名']
    russian_text = row['俄语列名']
    result = excel3_data[excel3_data['中文列名'] == chinese_text]
    if not result.empty and russian_text in result['俄语列名'].values:
        print(f"中文：{chinese_text}，俄语：{russian_text}，匹配成功")
    else:
        print(f"中文：{chinese_text}，俄语：{russian_text}，匹配失败")

# 将不匹配的记录保存到新的 Excel 文件中
mismatched_data = pd.DataFrame(columns=['中文列名', '俄语列名'])

for index, row in matched_data.iterrows():
    chinese_text = row['中文列名']
    russian_text = row['俄语列名']
    result = excel3_data[excel3_data['中文列名'] == chinese_text]
    if not result.empty and russian_text not in result['俄语列名'].values:
        mismatched_data = mismatched_data.append({'中文列名': chinese_text, '俄语列名': russian_text}, ignore_index=True)

mismatched_data.to_excel('mismatched_data.xlsx', index=False)

请确保将 'excel1.xlsx'、'excel2.xlsx'、'excel3.xlsx' 替换为你的实际文件名和路径。同样，将 '中文列名' 和 '俄语列名' 替换为你的实际列名。

此代码将依次执行读取 Excel 文件、对比中文和外文内容、搜索并比对翻译后的俄语，最后将不匹配的记录保存到名为 'mismatched_data.xlsx' 的新 Excel 文件中。

希望这个完整的代码示例对你有帮助。

如果以上回答对您有所帮助，点击一下采纳该答案～谢谢

编辑记录

报告相同问题？

关注问题

python写入excel文件中单个单元格换行问题 python
2022-12-09 09:15

回答 2 已采纳得对单元格对象设置自动换行。 cell.alignment=Alignment(wrapText=True)
python 操作excel时保留原始文件水印 python
2021-03-05 00:10

回答 2 已采纳是指这个水印吗？ xlswriter提供了设置页眉的功能，具体实现查看文档 worksheet.set_header('&L&G', {'image_left': 'logo.jpg'}
如何使用python给Excel报表文件加密码 python
2022-02-15 17:24

回答 5 已采纳建议看一下xlwings库，该库功能比较全，操作表格方面，api比较简单，加密只需一步，看看book类的api即可
python实现Excel文件转换为TXT文件
2020-09-19 10:33

Python是一种强大的编程语言，尤其在数据处理和分析领域有着广泛的应用。在上述的示例中，我们看到如何使用Python将Excel文件转换为TXT文件。这个过程对于数据科学家、分析师或任何需要处理大量结构化数据的人来说都...
利用python将ASC文件批量转为Excel文件 python
2021-01-22 15:18

回答 5 已采纳可以，发几个asc 文件给我
python编程解决问题 python 有问必答
2021-06-09 20:56

回答 2 已采纳 import random a=[] sum=0 max=0 min=1000 for i in range(20): a.append(random.randint(1,999))
为什么python找不到excel（入门问题） python
2022-05-20 06:44

回答 2 已采纳同意一楼，一个是路径的问题，要么把文件放到python运行空间路径下，可以直接写文件名字（相对路径）；要么就要写全文件的绝对路径。再一个，文件的名称和路径下尽量不要出现中文，要不然报错都没处找。
使用matlab或python将txt文件转为excel表格
2020-09-18 12:33

本文主要讨论如何使用MATLAB和Python这两种编程语言将文本文件（.txt）转换为Excel电子表格（.xls 或 .xlsx）。这两种语言都有强大的数据处理库，使得这个任务变得相对简单。首先，我们来看MATLAB的实现方式。...
用Python将 Excel 文件转化成.dat格式 python
2021-07-29 01:14

回答 1 已采纳 .dat不是一种标准文件格式，许多文件都使用这个扩展名，但文件含义不同。很多程序都有自己对dat文件的定义，所以dat文件的格式取决于使用它的程序。你这个dat文件是给什么程序用的？我以前用过做
为什么我用python写入excel文件无法保存 python
2021-04-11 18:45

回答 1 已采纳比如说我要改sheet1的A3单元格的值写法如下： wb = openpyxl.load_workbook(file) sheets = wb.sheetnames # 获取所有sheet
python怎么读取excel文件 python 有问必答
2022-01-21 18:05

回答 4 已采纳你题目的解答代码如下： import pandas as pd df = pd.read_excel('xxx.xlsx') print(df.loc[:,['列名1','列名3']]) #按列名取数
Python异步编程｜PySimpleGUI图形界面实例｜PDF表格转换Excel文件
2024-01-06 17:08

同时，我们还将了解如何将PDF表格转换为Excel文件。这些技能在数据分析、项目管理和自动化任务处理中非常实用。首先，让我们来讨论Python的异步编程。在Python中，异步编程主要通过`asyncio`库实现，它允许程序在...
python通过xlwings操作excel速度慢问题 python 有问必答
2022-03-30 18:54

回答 2 已采纳建议你第一次读取把数据存入列表，然后用一个创建一个迭代器对象进行循环删除，再重新写入，第一次循环完了列表多余项删除，然后再用新条件写入第二个表格，可以一行一行用offset写入。用time模块测一下看
cantools python语言，can dbc文件自动生成 excel 、C语言代码
2022-06-07 18:23

总的来说，cantools是一个强大的Python工具，它允许用户处理CAN数据，特别是DBC文件，将其转化为直观的Excel表格和可执行的C语言代码。对于需要处理CAN通信的工程师或开发者来说，这是一个非常有价值的工具，可以...
python读取Excel表格文件的方法
2020-09-18 17:03

Excel作为一种广泛使用的电子表格工具，存储着大量数据，而Python作为一门强大的编程语言，提供了读取和操作Excel文件的多种方法。在本篇文章中，我们将详细介绍如何使用Python来读取Excel表格文件。首先，需要...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 9月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月31日

悬赏问题

¥20 python忆阻器数字识别
¥15 无法输出helloworld
¥15 高通uboot 打印ubi init err 22
¥20 PDF元数据中的XMP媒体管理属性
¥15 R语言中lasso回归报错
¥15 网站突然不能访问了，上午还好好的
¥15 有没有dl可以帮弄”我去图书馆”秒选道具和积分
¥15 semrush,SEO,内嵌网站，api
¥15 Stata:为什么reghdfe后的因变量没有被发现识别啊
¥15 振荡电路，ADS仿真

Python excel多文件查询问题

14条回答 默认 最新

问题事件

悬赏问题

14条回答默认最新