之前所说的,就是用NLP的方式提取了角色名称的文本及位置。
我想用聚类来分析,然后这是一维的数据,发现聚类还真是略有尴尬。
不过不要紧,算法就是各种用途都可以。
聚类之后,得出中心点,聚类范围,聚类点数,这就是这个一维空间上角色的影响范围了。
得到一个角色的影响范围,再得到另一个角色的影响范围,我就可以再设计一个公式去计算这两个角色的亲密度/相关度。
这个数据有什么作用?至少能帮助编剧或者演员演不到主角的时候选一个合适的配角以保障出场率吧。
之前所说的,就是用NLP的方式提取了角色名称的文本及位置。
我想用聚类来分析,然后这是一维的数据,发现聚类还真是略有尴尬。
不过不要紧,算法就是各种用途都可以。
聚类之后,得出中心点,聚类范围,聚类点数,这就是这个一维空间上角色的影响范围了。
得到一个角色的影响范围,再得到另一个角色的影响范围,我就可以再设计一个公式去计算这两个角色的亲密度/相关度。
这个数据有什么作用?至少能帮助编剧或者演员演不到主角的时候选一个合适的配角以保障出场率吧。