Chciałbym napisać następujący kod w wektoryzacji, ponieważ obecny kod jest dość powolny (i chciałbym się nauczyć najlepszych praktyk Pythona). Zasadniczo kod mówi, że jeśli dzisiejsza wartość jest w granicach 10% wczorajszej wartości, to dzisiejsza wartość (w nowej kolumnie) jest taka sama jak wczorajsza wartość. W przeciwnym razie, dzisiejsza wartość jest niezmienna:Jak napisać kod w wektoryzacji zamiast używać pętli?
def test(df):
df['OldCol']=(100,115,101,100,99,70,72,75,78,80,110)
df['NewCol']=df['OldCol']
for i in range(1,len(df)-1):
if df['OldCol'][i]/df['OldCol'][i-1]>0.9 and df['OldCol'][i]/df['OldCol'][i-1]<1.1:
df['NewCol'][i]=df['NewCol'][i-1]
else:
df['NewCol'][i]=df['OldCol'][i]
return df['NewCol']
Wyjście powinno być następujące:
OldCol NewCol
0 100 100
1 115 115
2 101 101
3 100 101
4 99 101
5 70 70
6 72 70
7 75 70
8 78 70
9 80 70
10 110 110
Czy możesz pomóc?
chciałbym użyć czegoś takiego, ale nie udało się rozwiązać mój problem:
def test(df):
df['NewCol']=df['OldCol']
cond=np.where((df['OldCol'].shift(1)/df['OldCol']>0.9) & (df['OldCol'].shift(1)/df['OldCol']<1.1))
df['NewCol'][cond[0]]=df['NewCol'][cond[0]-1]
return df
'df' jest ramka danych, prawda? Co to jest 'dtype' z' df ['OldCol'] 'lub' NewCol '? Myślę, że jest to raczej dobry kod pandowy niż Pythoniczny. – hpaulj
Jaki jest pożądany wynik dla '' 'OldCol = (100,115,101,1009,9,70,72,75,78,80,81,82,110)' ''? – wwii