• 企业400电话
  • 微网小程序
  • AI电话机器人
  • 电商代运营
  • 全 部 栏 目

    企业400电话 网络优化推广 AI电话机器人 呼叫中心 网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    Python爬虫分析微博热搜关键词的实现代码

    1,使用到的第三方库
    requests
    BeautifulSoup 美味汤
    worldcloud 词云
    jieba 中文分词
    matplotlib 绘图
    2,代码实现部分

    import requests
    import wordcloud
    import jieba
    from bs4 import BeautifulSoup
    from matplotlib import pyplot as plt
    from pylab import mpl
    
    #设置字体
    mpl.rcParams['font.sans-serif'] = ['SimHei']
    mpl.rcParams['axes.unicode_minus'] = False
    
    url = 'https://s.weibo.com/top/summary?Refer=top_hottopnav=1wvr=6'
    
    try:
      #获取数据
      r = requests.get(url)
      r.raise_for_status()
      r.encoding = r.apparent_encoding
      soup = BeautifulSoup(r.text,'html.parser')
      data = soup.find_all('a')
      d_list = []
      for item in data:
        d_list.append(item.text)
      words = d_list[4:-11:]
      #中文分词
      result = list(jieba.cut(words[0]))
      for word in words[1::]:
        result.extend(jieba.cut(word))
      redata = []
      for it in result:
        if len(it) = 1:
          continue
        else:
          redata.append(it)
      result_str = ' '.join(redata)
      #输出词云图
      font = r'C:\Windows\Fonts\simhei.ttf'
      w = wordcloud.WordCloud(font_path=font,width=600,height=400)
      w.generate(result_str)
      w.to_file('微博热搜关键词词云.png')
      key = list(set(redata))
      x,y = [],[]
      #筛选数据
      for st in key:
        count = redata.count(st)
        if count = 1:
          continue
        else:
          x.append(st)
          y.append(count)
      x.sort()
      y.sort()
      #绘制结果图
      plt.plot(x,y)
      plt.show()
    except Exception as e:
      print(e)

     

    3,运行结果


    到此这篇关于Python爬虫分析微博热搜关键词的文章就介绍到这了,更多相关Python爬虫微博热搜内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

    您可能感兴趣的文章:
    • python一些性能分析的技巧
    • Python性能分析工具py-spy原理用法解析
    • Python内置类型性能分析过程实例
    • Python性能分析工具Profile使用实例
    • cProfile Python性能分析工具使用详解
    • Python中判断子串存在的性能比较及分析总结
    • 使用pycallgraph分析python代码函数调用流程以及框架解析
    • 使用bandit对目标python代码进行安全函数扫描的案例分析
    • python中delattr删除对象方法的代码分析
    • python3中确保枚举值代码分析
    • python如何做代码性能分析
    上一篇:anaconda升级sklearn版本的实现方法
    下一篇:sklearn中的交叉验证的实现(Cross-Validation)
  • 相关文章
  • 

    © 2016-2020 巨人网络通讯 版权所有

    《增值电信业务经营许可证》 苏ICP备15040257号-8

    Python爬虫分析微博热搜关键词的实现代码 Python,爬虫,分析,微博,热搜,