• 企业400电话
  • 微网小程序
  • AI电话机器人
  • 电商代运营
  • 全 部 栏 目

    企业400电话 网络优化推广 AI电话机器人 呼叫中心 网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    python如何读取.mtx文件

    mtx文件是按照稀疏矩阵格式存储的矩阵数据,可以按照以下步骤读取:

    1、安装scanpy包

    pip install scanpy

    2、文件读取

    import scanpy as sc 
    adata = sc.read(filename)
    data = adata.X

    第一行read之后返回的是annData,第二行通过.X操作得到的是矩阵数据

    3、转换为稠密矩阵

    data = data.todense()

    直接得到的矩阵是稀疏形式的,通过todense函数可转换为稠密矩阵

    补充:python读取各种文件方式

    Json:

    use_time=[]
    with open(address,'r') as f: #ubuntu
        mobile = json.load(f)
        calls = mobile["transactions"][0]["calls"]
    for call in calls: 
      use_time.append(str(call['use_time']))

    Excel:

    rawdata1=open_workbook(address)
    rawdata=rawdata1.sheet_by_index(0)
    for i in range(1,rawdata.nrows):
        if rawdata.cell(i,date_index).value=="": #跳过空行
            continue
        else:
            if ctype==3:  #若为3,则用datetime模块处理日期
                date1=rawdata.cell(i,date_index).value
                date2 = xldate_as_tuple(date1,0) 
                date3=datetime(*date2)
                if "." in str(rawdata.cell(i,phone_index).value):
                    phone1=str(rawdata.cell(i,phone_index).value)[:-2]  
                else:
                    phone1=str(rawdata.cell(i,phone_index).value)

    写EXCEL:

    Excel_file = xlwt.Workbook() 
    sheet = Excel_file.add_sheet('sheet0')
    header=[u'号码','日期top1','日期top2','日期top3']
    #写入标题行:
    for i in range(len(header)):
        sheet.write(0,i,header[i])
    #开始按行写入数据:
    for i in range(len(phonelist)):
        sheet.write(i+1,0,phonelist[i])
        sheet.write(i+1,1,dic[str(phonelist[i])])
    #保存EXCEL:
    Excel_file.save("C:/Users/Desktop/100个文件输出xls/"+str(fileName)+".xls")

    CSV:

    rawdata=pd.read_csv(address,skip_blank_lines=True) #参数为去除空行
    if 'start_time' or 'begin_time'  in rawdata.columns:
        if 'start_time' in rawdata.columns:
            start_time=rawdata['start_time']
        elif 'begin_time' in rawdata.columns:
                start_time=rawdata['begin_time']

    txt:

    rawdata=open(address,'r')
    i=0
    a=[] #c存放第一行的列名
    for line in rawdata:
        if i==1: #默认第二行开始存储通话数据
            a=line.split(',') #逗号作为分隔符
            for j in range(len(a)): #查找指定列名所在的列下标
                if (('-' in str(a[j]))or('/' in str(a[j]))): #判断日期所在列数
                    date_index=j #保存日期的列下标
                elif  str(a[j]).isdigit() and len(str(a[j]))>5: #默认全为数字组成的字符串为电话号码
                    phone_index=j
                else:
                    pass
            break
        else:
            i+=1
    i=0
    for line in rawdata:#开始转存数据:
        if len(line)10: #跳过空行
            continue
        data_line=line.split(',') #txt默认以','分隔数据
        if i==0:
            pass #第一行为列名,跳过
            i+=1
        else: #从第二行开始保存数据
            start_time.append(data_line[date_index])
    

    以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。

    上一篇:Python中tkinter的用户登录管理的实现
    下一篇:python 三边测量定位的实现代码
  • 相关文章
  • 

    © 2016-2020 巨人网络通讯 版权所有

    《增值电信业务经营许可证》 苏ICP备15040257号-8

    python如何读取.mtx文件 python,如何,读取,.mtx,文件,