|
本帖最后由 caisqy 于 2022-10-12 20:56 编辑
爬虫得到多行字典的txt,想得到希望的格式,如图所示:
请高手解答
附上代码
import pandas as pd
f = open("dic9.txt",'r',encoding= 'utf-8') #打开文件
lines = f.readlines() #逐行读取,成为列表,但里面包含了一些冗余字符
str_lines = str(lines).replace("'","").replace(r"\n","") #转字符串,便于删除冗余字符
list_dict = eval(str_lines) #从字符串转回包含字典的列表[{'Key1':'Value1_1','Key2':'Value2_1','Key3':'Value3_1',……},{},{},{}]
df = pd.DataFrame(list_dict)
df.to_excel("movie_out.xlsx")
print(df.head())
|
-
希望的格式
-
爬虫得到的数据
|