诚然,我有一个关系表(思考人有一个物品),我成功地把这个表装成一个ool子。 我想走下一个步骤,并为任何特定用户之间的距离找到一个矩阵。
我知道,我是否想在距离外走一条路,我基本上可以做以下工作:
df = ...
df["val"] = 1
pivot = df.pivot(index="person", columns="hasa", values="val").fillna(0)
# compute one difference
(pivot["Alice"] - pivot["Carol"]).abs().sum()
我不知道如何从这里到完整的数据框架。
Initial table
person | hasa |
---|---|
Alice | Apple |
Bob | Banana |
Carol | Carrot |
Bob | Apple |
Pivot Table
Apple | Banana | Carrot | |
---|---|---|---|
Alice | 1 | 0 | 0 |
Bob | 1 | 1 | 0 |
Carol | 0 | 0 | 1 |
Goal Table
Alice | Bob | Carol | |
---|---|---|---|
Alice | 0 | 1 | 2 |
Bob | 1 | 0 | 3 |
Carol | 2 | 3 | 0 |