爬取电影评论生成词云
一部豆瓣评分2.2的电影,评论区得惨成什么样 爬取《纯洁心灵·逐梦演艺圈》的影评,生成词云 公众号“红河掌圈”回复【2007】获取评论文本 图片遮罩的网页词云得二次刷新,这是bug,等待大佬解决 评...
一部豆瓣评分2.2的电影,评论区得惨成什么样 爬取《纯洁心灵·逐梦演艺圈》的影评,生成词云 公众号“红河掌圈”回复【2007】获取评论文本 图片遮罩的网页词云得二次刷新,这是bug,等待大佬解决 评...
收集新闻时间,内容摘要,视频链接 网站的新闻摘要很随意,大部分都没写,视频是高清的,没有水印,可以直接下载 公众号“红河掌圈”回复【2006】下载文件 有500多个视频,比较大,可以导入...
百度智能免费提供5万普通音库,2000精品音库 说明文档讲的太高端,看得费力,其实几行代码就满足基本使用了 简单调节在synthesis中添加字典参数 如:option = {‘vol&#...
爬取【赘婿】全部1144章,每章单独保存为一个txt文件 共16.8m,简单计算一下超过500万字,制作mp3大概需要40G左右,我没全弄,文末有代码 让电脑阅读每个文件,并保存为同名的mp3格式 公...
包含医院名称、等级、电话、地址、科室 有人不会用csv文件,这个我保存为excel文件了 公众号【红河掌圈】回复【2005】获取数据文件链接 excel文件并不适合存储量很大的数据,如果不...
爬取京东前200页【鞋子】的销售数据,统计各尺码的销售占比 销量太低、尺码定义清奇的都清洗了,只统计传统尺码 最终参与计算的数据大约10万条左右 鞋子制造厂或销售商采集数据时通常要求更精确,比如:童鞋...
本来是收集了【尺码,颜色,评论,追加】,打算分析用户最喜欢的颜色和最好卖的尺码 结果99%的用户选择同一颜色,同一尺码,这明显是刷单,数据不客观明天重来过 虽然网购的评论没多少参考价值,但用评论做词云...
近期评论