如何返回每个用户id板块最多的所有记录

gulie8 2019-06-25 11:31:27
如何返回每个用户id板块最多的所有记录
如下所示:

用户id 小区名称 房源所在区域 房源所在板块 房源户型 房源预算
u100381236 宝虹家园, 宝山区 罗泾 3室 200万-250万
u100381236 长虹路778弄, 宝山区 罗泾 3室 250万-350万
u100381236 旭辉城(旭辉澜悦湾-潘泾路4777弄), 宝山区 罗泾 3室 250万-350万
u100381236 凉城路1201弄, 虹口区 江湾凉城 2室 200万-250万
u100381236 金属新村, 虹口区 广中 2室 250万-350万
u100381236 车站北路491弄, 虹口区 江湾凉城 2室 250万-350万
u100381236 万康小区, 虹口区 江湾凉城 2室 200万-250万
u100381236 延吉五村, 杨浦区 黄兴 2室 250万-350万
u100381236 院东大楼, 杨浦区 东外滩 2室 250万-350万
u100381236 延吉七村, 杨浦区 控江 2室 250万-350万
u100381236 控江四村, 杨浦区 控江 2室 250万-350万
u100381236 中原纪联小区, 杨浦区 中原 2室 200万-250万
u100381767 碧云东方公寓, 浦东 碧云 3室 12000元以上
u100382964 仓城四村, 松江 松江老城 2室 150万-200万
u100382964 长海二村, 杨浦区 中原 1室 150万-200万
u100382964 长海一村, 杨浦区 五角场 2室 250万-350万
u100382964 长海一村, 杨浦区 五角场 1室 150万-200万
u100382964 民星路350弄, 杨浦区 中原 1室 150万-200万
u100382964 开鲁四村, 杨浦区 中原 2室 250万-350万
u100382964 开鲁四村, 杨浦区 中原 1室 150万-200万
u100382964 怡福苑, 杨浦区 五角场 2室 350万-500万
u100382989 延吉七村, 杨浦区 控江 1室 250万-350万
u100382989 延吉六村, 杨浦区 黄兴 1室 250万-350万
u100382989 延吉三村, 杨浦区 黄兴 1室 150万-200万
u100382989 延吉七村, 杨浦区 控江 2室 250万-350万
u100382989 控江二村, 杨浦区 控江 1室 150万-200万
u100382989 控江二村(107弄), 杨浦区 控江 1室 150万以下
u100382989 延吉六村, 杨浦区 黄兴 2室 350万-500万
u100382989 控江二村(107弄), 杨浦区 控江 1室 200万-250万
u100382989 控江二村(107弄), 杨浦区 控江 1室 150万-200万
u100382989 延吉六村, 杨浦区 黄兴 1室 200万-250万
u100382989 延吉七村, 杨浦区 控江 1室 200万-250万
u100383192 生安花园, 浦东 洋泾 3室 1000万以上
u100383192 第五大道(东方中华园), 浦东 洋泾 2室 700万-1000万
u100383192 生安花园, 浦东 洋泾 4室 1000万以上
u100383192 民生家园, 浦东 洋泾 2室 500万-700万
u100383192 第五大道(东方中华园), 浦东 洋泾 2室 1000万以上
u100383192 第五大道(东方中华园), 浦东 洋泾 3室 1000万以上
u100383192 第五大道(东方中华园), 浦东 洋泾 1室 700万-1000万

我的目的是取出每个用户id,'板块'数最多的记录。
u100381236 宝虹家园, 宝山区 罗泾 3室 200万-250万
u100381236 长虹路778弄, 宝山区 罗泾 3室 250万-350万
u100381236 旭辉城(旭辉澜悦湾-潘泾路4777弄), 宝山区 罗泾 3室 250万-350万
u100381236 凉城路1201弄, 虹口区 江湾凉城 2室 200万-250万
u100381236 金属新村, 虹口区 广中 2室 250万-350万
u100381236 车站北路491弄, 虹口区 江湾凉城 2室 250万-350万
u100381236 万康小区, 虹口区 江湾凉城 2室 200万-250万
u100381236 延吉五村, 杨浦区 黄兴 2室 250万-350万
u100381236 院东大楼, 杨浦区 东外滩 2室 250万-350万
u100381236 延吉七村, 杨浦区 控江 2室 250万-350万
u100381236 控江四村, 杨浦区 控江 2室 250万-350万
u100381236 中原纪联小区, 杨浦区 中原 2室 200万-250万

如“u100381236”,就返回:
用户id 小区名称 房源所在区域 房源所在板块 房源户型 房源预算
u100381236 宝虹家园, 宝山区 罗泾 3室 200万-250万
u100381236 长虹路778弄, 宝山区 罗泾 3室 250万-350万
u100381236 旭辉城(旭辉澜悦湾-潘泾路4777弄), 宝山区 罗泾 3室 250万-350万
u100381236 凉城路1201弄, 虹口区 江湾凉城 2室 200万-250万
u100381236 车站北路491弄, 虹口区 江湾凉城 2室 250万-350万
u100381236 万康小区, 虹口区 江湾凉城 2室 200万-250万
...全文
136 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
陈年椰子 2019-06-26
  • 打赏
  • 举报
回复


import  pandas as pd

df1 = pd.read_csv('data/data.csv', encoding='gbk')
df1['TJ'] = 1
# print(df1)
df2=df1.groupby(['用户id','房源所在板块'], as_index=False)['TJ'].count()
# print(df2)
gp=df2.groupby(['用户id']).apply(lambda t: t[t.TJ==t.TJ.max()])

check_id = 'u100381236'

area_list = []
for index, row in gp.iterrows():
    if row['用户id'] == check_id:
        print(row['用户id'], row['房源所在板块'])
        area_list.append(row['房源所在板块'])
df_r = df1[(df1['用户id'] == check_id) & (df1['房源所在板块'].isin(area_list)) ]
print(df_r)

引用 楼主 gulie8 的回复:
如何返回每个用户id板块最多的所有记录

37,720

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧