• 企业400电话
  • 微网小程序
  • AI电话机器人
  • 电商代运营
  • 全 部 栏 目

    企业400电话 网络优化推广 AI电话机器人 呼叫中心 网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    python 利用百度API进行淘宝评论关键词提取

    利用百度API自然语言处理技术中的评论观点抽取方面,对淘宝购物的评论进行分析,把关键词进行提取,方便买家快速了解该商品的相关特点,具体实现过程如下:

    1、创建相关新应用

    首先,需要登录百度AI平台,创建一个关于自然语言处理技术的应用(领取免费额度),获得AppID、API Key和Secret Key如下:

    然后下载Python的SDK,然后可以通过阅读API的使用手册和自然语言处理技术的观点抽取相关案例:

    2、获取Access Token

    使用百度API时需要先获取Access Token,并且需要用到上一步获取的参数API Key和Secret Key,在百度给出的使用说明中,建议用POST的方式对URL进行请求来获取access_token,同时可以加入Header,该方式支持UTF-8编码,具体实现代码如下:

    import json
    import time
    import requests
    from urllib.request import urlopen
    
    #定义获取token函数
    def get_token():
      req = Request(Token_url)
      req.add_header('Content-Type', 'application/json; charset=UTF-8')
      try:
        f = urlopen(req,timeout=5)
        result_str = f.read().decode('utf-8')
      except URLError as err:
        print(err)
      result = json.loads(result_str)
      #返回Access Token字符串
      return result['access_token']

    3、分析评论并进行观点抽取

    在获取Access Token后就可以使用百度API对评论进行分析并抽取关键词。在使用说明中,调用API时需要输入参数text和type,其中text为需要分析的文本,而type分成了13各类别,具体取值说明如下:

    因为本文分析的是淘宝购物评论文本数据,所以该参数取值选择了12。其次,返回格式需要指定输入为UTF-8编码,对于调用后返回的参数,本文用到了prop、adj和sentiment三个参数,解释如下:

    具体实现代码如下:

    def analysis_comment(host,comment):
      #定义分析类别(购物)
      data = json.dumps(
        {
          "text":comment,
          "type":12
        })
        
      request = Request(url=host,data=data.encode('utf-8'))
      request.add_header('Content-Type', 'application/json; charset=UTF-8')
      response = urlopen(request)
      content = response.read().decode('utf-8')
      rdata = json.loads(content)
    
      print("--------------------------------------------------------------")
      print("评论:")
      print("  " + comment)
      print("\n评论关键字:")
      #把积极、中性、消极关键词分类出来并打印
      for item in rdata['items']:
        if item['sentiment'] == 2:
          print(u"  积极的评论关键词:" + item['prop'] + item['adj'])
        if item['sentiment'] == 1:
          print(u"  中性的评论关键词:" + item['prop'] + item['adj'])
        if item['sentiment'] == 0:
          print(u"  消极的评论关键词:" + item['prop'] + item['adj'])

    4、运行结果

    在对上述函数进行定义后,运行改代码,调用函数:

    if __name__ == '__main__':
      #定义访问url(API Key和Secret Key换成自己的)
      Comment_url = "https://aip.baidubce.com/rpc/2.0/nlp/v2/comment_tag"
      Token_url = "https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentialsclient_id=your_API_Keyclient_secret=your_Secret_Key"
    
      A_t = get_token()
      host = Comment_url + "?charset=UTF-8access_token="+A_t
      
      comment1 = {"text":"版型不错,颜色很好看,面料非常舒服而且厚度适中"}
      comment2 = {"text":"上身效果一般,做工也一般,会有点起球,没有想象中好"}
      comment3 = {"text":"设计做工一点都不好,袖子特别长,衣服比例设计非常差,性价比不高"}
      comment1 = comment1["text"]
      comment2 = comment2["text"]
      comment3 = comment3["text"]
      
      analysis_comment(host,comment1)
      analysis_comment(host,comment2)
      analysis_comment(host,comment3)

    运行结果如下:

    然而,从结果中可以看出,在第二句评论中,“一般”这个词应该定义为中性,而该模型将其定义为消极,说明该模型在一定程度上仍存在一些瑕疵,这也是后期需要改进的地方。

    以上就是python 利用百度API进行淘宝评论关键词提取的详细内容,更多关于python 淘宝评论关键词提取的资料请关注脚本之家其它相关文章!

    您可能感兴趣的文章:
    • python自动化调用百度api解决验证码
    • python调用百度API实现人脸识别
    • python调用api实例讲解
    • Python 调用API发送邮件
    • python基于爬虫+django,打造个性化API接口
    • python3 kubernetes api的使用示例
    • python调用jenkinsAPI构建jenkins,并传递参数的示例
    • 用 Django 开发一个 Python Web API的方法步骤
    • Python api构建tensorrt加速模型的步骤详解
    上一篇:pandas 颠倒列顺序的两种解决方案
    下一篇:Python爬虫爬取全球疫情数据并存储到mysql数据库的步骤
  • 相关文章
  • 

    © 2016-2020 巨人网络通讯 版权所有

    《增值电信业务经营许可证》 苏ICP备15040257号-8

    python 利用百度API进行淘宝评论关键词提取 python,利用,百度,API,进行,