现在有一个 excel 表格,如图 https://imgur.com/DhZDVZK
需求:
A 列出现了重复的数据,需要去除重复的行。
需要根据 date2 这列数据判断,保留日期比较新的一行。
如果 date2 数据为空,要根据 date1 数据判断,保留日期比较新的一行。
最后将去重的表格保存到原 excel 的新 sheet
目前状况:
我只会根据一列去重。代码如下
# -*- coding: utf-8 -*-
from __future__ import print_function
import pandas as pd
# 读取 Excel 中 Sheet1 中的数据
data = pd.DataFrame(pd.read_excel(r'C:\Users\140082\Desktop\去重测试.xlsx', 'Sheet1'))
# 查看基于[name]列去除重复行的数据
wp = data.drop_duplicates(['name'])
print(wp)
请问我要怎么完成需求啊,大佬求解答!
需求:
A 列出现了重复的数据,需要去除重复的行。
需要根据 date2 这列数据判断,保留日期比较新的一行。
如果 date2 数据为空,要根据 date1 数据判断,保留日期比较新的一行。
最后将去重的表格保存到原 excel 的新 sheet
目前状况:
我只会根据一列去重。代码如下
# -*- coding: utf-8 -*-
from __future__ import print_function
import pandas as pd
# 读取 Excel 中 Sheet1 中的数据
data = pd.DataFrame(pd.read_excel(r'C:\Users\140082\Desktop\去重测试.xlsx', 'Sheet1'))
# 查看基于[name]列去除重复行的数据
wp = data.drop_duplicates(['name'])
print(wp)
请问我要怎么完成需求啊,大佬求解答!