狗熊会吧 关注:48贴子:469
  • 3回复贴,共1

数据揭秘三国:用统计数据分析三国演义人物阵营变化

只看楼主收藏回复

作为中国文学史上第一部章回小说,《三国演义》为我们展示出了一幅波澜壮阔乱世英雄争天下的历史画面,故事情节随着几大人物阵营的演变紧紧抓牢看客眼球。那么随着时间推移,三国人物阵营是怎样变化的呢?狗熊会根据《三国演义》原著电子版汉语文本,应用文本分析、关联规则挖掘和社区探测技术,数据挖掘角度分析三国各个时期的人物阵营情况。
数据说明
1、本案例数据来源于《三国演义》原著电子版和《三国演义》人物总表,人物总表说明如下:
(1) 人名总表中包含1152人。
(2) 不包含“单于”、“督邮”、“山神”、“梨树神”、“师婆”等不确切指代某一个人的人名。
(3) 收集了人物的姓名、字号和别称。有些人物的字号,虽史书上有记载,但在《三国演义》中未提及,不列入此表。
2、对每一自然段出场人物进行统计
根据人物总表中的姓名、字号、别称,统计每一自然段中出现的人物。例如,某自然段中提到“曹操”或“孟德”或“阿瞒”,均认为“曹操”在该段出场。有两种情况需要特殊说明:
首先,根据作者用词习惯,若某一自然段中用某人物的“名”代替该人物,则上一自然段中提到过此人。例如:
“董卓屯兵城外,每日带铁甲马军入城,横行街市,百姓惶惶不安。卓出入宫庭,略无忌惮…”
“…‘不可!不可!汝是何人,敢发大语?天子乃先帝嫡子,初无过失,何得妄议废立!汝欲为篡逆耶?’卓视之,乃荆州刺史丁原也…”
处理方法为:如果第i自然段出现了人物x,则在第i+1自然段需对人物x的“名”进行匹配,并以此递归。
其次是特殊人物的处理。例如:“张飞”和“张翼”。为了准确地统计此二人的出场频次,将“张翼德”统一替换为“张飞”。再如:两个“马忠”。一个来自吴国,一个来自蜀国,并非罗**误,三国时期确实存在两个“马忠”。由于二人出场时间不同,遂将第八十五回之前的“马忠”替换为“马忠(吴)”,第八十六回之后的“马忠”替换为“马忠(蜀)”。
3、把原著一百二十回,根据故事情节划分为八个部分。


1楼2018-11-02 14:05回复
    狗熊会原创,更多内容登录平台查询~


    3楼2018-11-02 14:08
    回复
      没啦?


      4楼2020-03-06 14:18
      回复
        同问,精品案例怎么查看


        IP属地:上海6楼2021-04-15 17:43
        回复