python – 找出给定数据集中每列中缺失值的百分比

weixin_38114194 2019-09-12 12:25:10
import pandas as pd df = pd.read_csv('https://query.data.world/s/Hfu_PsEuD1Z_yJHmGaxWTxvkz7W_b0') percent= 100*(len(df.loc[:,df.isnull().sum(axis=0)>=1 ].index) / len(df.index)) print(round(percent,2)) 输入是https://query.data.world/s/Hfu_PsEuD1Z_yJHmGaxWTxvkz7W_b0 输出应该是 Ord_id 0.00 Prod_id 0.00 Ship_id 0.00 Cust_id 0.00 Sales 0.24 Discount 0.65 Order_Quantity 0.65 Profit 0.65 Shipping_Cost 0.65 Product_Base_Margin 1.30 dtype: float64
...全文
1144 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
weixin_38125291 2019-09-12
  • 打赏
  • 举报
回复
这个怎么样?我想我之前在这里曾经发现了类似的东西,但我现在还没有看到它…… columns = df.columns percent_missing = df.isnull().sum() * 100 / len(df) missing_value_df = pd.DataFrame({'column_name': columns, 'percent_missing': percent_missing}) 如果您希望将缺失的百分比排序,请按照上述步骤操作: missing_value_df.sort_values('percent_missing', inplace=True) 正如评论中所提到的,你也可以在我上面的第一个代码中仅使用第二行,即: percent_missing = df.isnull().sum() * 100 / len(df)

433

社区成员

发帖
与我相关
我的任务
社区描述
其他技术讨论专区
其他 技术论坛(原bbs)
社区管理员
  • 其他技术讨论专区社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧