【pandas】文本处理:如何将相同ID的字符串进行合并

需求:统计每个用户下的评论,合并在一起

原评论 内容有点刺激

合并后是list

 再次转为字符串,有的中间是连续两个标点符号,这种先不管,后续清理

 最后的代码

 最后源码

df_comms_merge=df1.groupby('fromUserUid').apply(lambda x: ','.join(x['content']))

print(df_comms_merge.iloc[-1]) print(df_comms_merge.index[-1])

  # 关键点解释:

# groupby('fromUserUid'):需要分组的字段
# join(x['content'])]):需要合并字符串的字段

公式:df.groupby('分组字段').apply(lambda x: ','.join(x['合并字段']))

【 思维拓展 】:join前面可以改成自己喜欢格式,比如| + 等

资料参考:https://blog.csdn.net/qq_32618817/article/details/80430841

原文地址:https://www.cnblogs.com/hightech/p/13171806.html