u010001866 2021-01-17 21:56 采纳率: 100%
浏览 27
已采纳

Python数据筛选

现在有一组数据user_data如下

          user_id	                name  review_count  yelping_since	  useful	funny	  cool  
0	ntlvfPzc8eglqvk92iDIAw	Rafael	 553	2007-07-06 03:27:11	   628      225 	 227   
1	FOBRPlBHa3WPHFB5qYDlVg	Michelle 564	2008-04-28 01:29:25	   790	    316       400 
2	zZUnPeh2hEp0WydbAZEOOg	Martin	 60	    2008-08-28 23:40:05	   151	    125	      103      
3	QaELAmRcDc5TfJEylaaP8g	John	 206	2008-09-20 00:08:14	   233	    160       84       
4	xvu8G900tezTzbbfqmTKvA	Anne	 485	2008-08-09 00:30:27	  1265	    400	      512   

然后现在有一个类型为series的id_list包含了其中几个user_id.

           user_id
0	ntlvfPzc8eglqvk92iDIAw
1	zZUnPeh2hEp0WydbAZEOOg
2	V3t6VJNcO7yXslIJHG7nyA
3   QaELAmRcDc5TfJEylaaP8g

其中包含的id有的在数据集的use_id中存在,有的不在数据集的use_id中存在。

现在想通过这一列id_list进行过筛,找出user_id中包含id_list中存在的数据的数据,请问代码怎么写。

我尝试了很多

以下代码都不行

	
uuid = uuid.filter(id_list)
 
uuid = user_data[user_data['user_id'],]==id_list]

uuid = user_data[user_data['user_id'] in id_list]
  • 写回答

5条回答 默认 最新

  • 深白色的风 2021-01-18 18:39
    关注
    import pandas as pd
    
    user_data = pd.read_csv("C:\\Users\ECIDI\Desktop\\test.csv")
    print(user_data)
    id_list = pd.Series(
        ["ntlvfPzc8eglqvk92iDIAw", "zZUnPeh2hEp0WydbAZEOOg", "V3t6VJNcO7yXslIJHG7nyA", "QaELAmRcDc5TfJEylaaP8g"]
        )
    
    uuid = user_data[user_data.user_id.str.contains('|'.join(list(id_list)))]
    print(uuid)

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(4条)

报告相同问题?

悬赏问题

  • ¥15 cplex运行后参数报错是为什么
  • ¥15 之前不小心删了pycharm的文件,后面重新安装之后软件打不开了
  • ¥15 vue3获取动态宽度,刷新后动态宽度值为0
  • ¥15 升腾威讯云桌面V2.0.0摄像头问题
  • ¥15 关于Python的会计设计
  • ¥15 聚类分析 设计k-均值算法分类器,对一组二维模式向量进行分类。
  • ¥15 stm32c8t6工程,使用hal库
  • ¥15 找能接spark如图片的,可议价
  • ¥15 关于#单片机#的问题,请各位专家解答!
  • ¥15 博通raid 的写入速度很高也很低