只要判定雷同的标准不变,世界上能够创作歌曲的总数大约为 7 2596 1467 9066 5561 首。
按现有的实践,如果一首歌出现连续的 4 小节与另一首歌曲的片段相同,在结合其他更详细的判定标准,就可能判定为抄袭;如果连续 8 小节相同,就一定会被判定为抄袭。平均来看,6 小节相同就算抄袭。
通常来讲,每小节包含 4 个音,如
拍的歌曲多用八分音符,
拍的多用四分音符。则 6 小节共包含 24 个音。只用 7 种自然音,本质上不同的“6 小节”就共有 种。减 1 是因为换个调不影响重复的判定。
这里不考虑变化音(升降号)、更短的音符(每小节有多于 4 个音)、音组(重音 1 和高音 1 的区别),但前两者不常用(或者说“变化音的使用”与“fa(4)与 si(7)出现频率较少”互补,“更短音符或不同节奏型”与“长音或重复音使用频率较多”互补),相邻旋律音之差总是在八度之内。
多数流行歌曲包含 80~120 小节。按 100 小节计算,则一首歌有 400 个旋律音,共包含
组“6 小节”(1~24、2~25、…、377~400)。所以,按现有判雷同实践,全世界最多能够创作约 首歌曲。
按类似的计算方法,全世界总共能写出 1 1727 7992 2779 9228 篇论文。
中文论文判相似的标准是“8 个连续汉字相同算相似,相似内容达到 20%算雷同”。但判雷同是各种语言一起算的,只要意思相同,换一种语言照样算雷同,所以只需要按中文计算。
通常来讲,论文的字数为 3000~10 0000 字,这里按 1 0000 字计算。
汉语的核心常用字有 300 个,使用频率为 70%;一级常用字有 1000 个,使用频率为 92%;一、二级常用字有 2000 个,使用频率为 99%。
所以一篇论文约含有
个核心常用字,这些字能组成
个 8 字组,非重复部分不低于
组。
由核心常用字组成的 8 字组共
个,所以理论上全世界能创作论文的总篇数为 篇。
按一级常用字(或一、二级常用字)计算,得到结果的数量级为
(或
),大于用核心常用字得到的结果,所以上面的数字即最终结果。
控制判定雷同的标准使本质上不同的内容数目的数量级在 左右,几乎是人们的共识。根据相关资料,选择题涂答题卡的判同标准也把阈值定在了
。