欧美一区2区三区4区公司二百,国产精品婷婷午夜在线观看,自拍偷拍亚洲精品,国产美女诱惑一区二区

python數據處理常用方法

1、讀取指定sheet和指定列的內容

data = pd.read_excel("data.xlsx",sheet_name="Sheet1",usecols=["year","code1","code2","name","keywords","type",'new'])

?

2、遍歷數據,對兩列數據相似度比較

for i in range(0,75065):
? ? if data.loc[i]['code2']!=0:
? ? ? ? if data.loc[i]['code1'][:5]==data.loc[i]['code2'][:5]:
? ? ? ? ? ? data.loc[i,'inter']=0
? ? ? ? elif data.loc[i]['code1'][:3]==data.loc[i]['code2'][:3]:
? ? ? ? ? ? data.loc[i,'inter']=1
? ? ? ? elif data.loc[i]['code1'][:1]==data.loc[i]['code2'][:1]:
? ? ? ? ? ? data.loc[i,'inter']=2
? ? ? ? else:
? ? ? ? ? ? data.loc[i,'inter']=3

3、遍歷數據,統計每類分類變量的數量

list= ['fund','year','inter','age','degree','title','institute','economy','gender','type']
for i in range(0,10):
? ? print(data[list[i]].value_counts())

4、遍歷數據,刪除某列為特定值的數據

df_clear = data.drop(data[data['discipline']=="H"].index)

5、正則去掉字符串左邊或者右邊的內容

import re
template = "DF','17340','http://www.zgglkx.com','2021','205')"

delete_left = template.lstrip('"DF')
print(delete_left)

delete_right = template.rstrip('205\')')
print(delete_right)

文章鏈接: http://www.qzkangyuan.com/19221.html

文章標題:python數據處理常用方法

文章版權:夢飛科技所發布的內容,部分為原創文章,轉載請注明來源,網絡轉載文章如有侵權請聯系我們!

聲明:本站所有文章,如無特殊說明或標注,均為本站原創發布。任何個人或組織,在未征得本站同意時,禁止復制、盜用、采集、發布本站內容到任何網站、書籍等各類媒體平臺。如若本站內容侵犯了原著者的合法權益,可聯系我們進行處理。

給TA打賞
共{{data.count}}人
人已打賞
建站教程

服務器用什么Linux系統好

2023-3-31 12:23:35

建站教程

python數據處理常用方法(二)

2023-4-3 13:07:37

0 條回復 A文章作者 M管理員
    暫無討論,說說你的看法吧
?
個人中心
購物車
優惠劵
今日簽到
有新私信 私信列表
搜索
主站蜘蛛池模板: 西林县| 平山县| 固安县| 乐山市| 临颍县| 汕头市| 长沙县| 工布江达县| 如皋市| 金川县| 葵青区| 读书| 湘潭县| 栖霞市| 延长县| 龙海市| 镇康县| 康平县| 石屏县| 工布江达县| 保康县| 曲松县| 张家川| 大同县| 盐边县| 师宗县| 隆尧县| 商都县| 鄂尔多斯市| 汝州市| 蒙山县| 临武县| 无为县| 南川市| 西平县| 方城县| 观塘区| 卢氏县| 宁安市| 莱阳市| 小金县|