https://josherich.github.io/gradient-reader/
分享一个验证想法的 demo,主要功能是根据词频在文字背后加入对应的灰度
这里有几点可以探索的地方:
词频词典的质量对效果影响很大
词频辅助在多大程度上有助于阅读,或者说,有助于阅读某种类型的文字
结合 name entity 和 POS tagger 是否有更好的效果
1
est 2019 年 10 月 15 日
我打开就看到一个 textarea 一段文本。我漏掉了什么吗?
|
3
grimpil 2019 年 10 月 15 日 via Android
如果是根据情感分析给文字加上不同的背景色,会不会很花很辣眼
|
4
oisc 2019 年 10 月 15 日
楼主想法很好,我这里给个拙劣的建议。我们一般说词语有 content word (内容词) 和 function word (功能词),按照 IDF 挑出来的词一般是内容词。但是中文作为一种表意的语言想要做到准确是需要功能词支撑的,词的粒度是不是太小了?
可以参考一下英文的一些技术: 曾经很火的 https://www.spritz.com demo: https://codepen.io/keithwyland/pen/JztfD 另外有本书叫 《眼动追踪和中文阅读》,希望楼主能继续研究下去。 |
6
josherich OP @oisc 对,这里其实只用了全局词频,如果对文档词频平均,一些主题词会变淡。但有时主题词是需要的,可以帮助读者定位文本中关键的几个方位。
你说的没错,这个工具的目标是突出语义层面上的比较和变化,从字到词,到短语句子,再到段落,我的感觉是不同层面需要结合起来运用。 感谢推荐,我去看看 |
7
zhigang1992 2019 年 10 月 17 日
|
8
josherich OP @zhigang1992 这个是用了英文中的词根 /词干 或者说 unique prefix 来加快阅读速度,中文没法这么标记。
我的想法是用标记词频的方式,既可以突出重点词,也可以起到英文中空格的作用 |
9
killpigman 2019 年 10 月 18 日
我看着颜色怎么都一样??
|