需要少数字母。活字印刷和机械打字机的时代汉字非常吃亏,所以当年中日都有很多人提倡要搞拼音化。”
“事情的转折点要到1980年代后期,随着输入法、激光照排等各种用计算机处理汉字的系统的成熟,废除汉字论就渐渐地淡出了。”
“在互联网时代,汉字输入不吃亏,阅读起来还有优势,还记得先前提到的汉字的优点吧,这里引入一个概念,信息熵,记好笔记,后面会用到。”
陈博记得十分从容,落笔丝毫不慌,甚至还饶有兴致的练起了正楷,和大多数老师的讲课方式并无两异,要么是照本宣科故意拖慢节奏念PPT,要么是结合各种时政热点抖机灵讲段子。
两者的共同点是一节课里真正要记的东西其实不多,但为了水课时,只能想尽法子混。
“我国的视频节目做视频的时候就加上字幕的比例,远高于欧美,也比日本高,可能和中国互相不通的方言众多也有关,十里不同音,百里不同俗。”
“我国的观众习惯在视频节目中看字幕,因而古风歌曲、鬼畜才可能流行,因为没有字幕是很难光靠听听懂的这类作品的。”
“有人说弹幕都是短语,不需要什么语法,外文弹幕网站也完全可以形成自己的文化,使用各种简写,这里我们上一个对比视频,同样的弹幕内容,英文呈现出来的观感是不是明显差了点。”
陈博顺手截了个图,虽然英文弹幕的密集程度远不如中文,可字母间的遮挡严重影响了对弹幕内容的判断,反观中文弹幕这边,密密麻麻的字幕丝毫不影响陈博提取出弹幕内容。
汉字的倒序乱码在一定程度上不会影响读者的阅读体验,但丢失单个关键字符就波及整体,例如我去找他要钅,到底是要什么,要钱还是要铁要铜。
这点在英语方面恰恰相反,即便丢失了一部分后缀前缀,仍然不会影响对句子的整体理解,正是因为英文单个字符所提供的信息量较少。
“根据最新出版的各语言信息熵目录,汉字单个字体的平均信息熵在9.68左右,而英文的信息熵则在3.23徘徊,信息熵越高,代表越无序,关于信息熵的计算过程,有兴趣的同学可以看看下面的公式和延伸阅读。”
陈博顺着老师的指引点开链接,马上被一堆不知所云的公式下愣在原地,他借助看得懂的文字说明,试着对这些陌生的公式进行解读。
语言自身所拥有的符号越多,信息熵越大,英语字母看起来有26个,实际上能组合起来
本章未完,请点击下一页继续阅读!