出處:數據挖掘:文學的六種情感弧線
這條音頻跟你說一說,我們讀的那些小說,在感性的文字背後,
還隱藏著怎樣的數學規律和理性之美。
今年2月份的《科學美國人》雜誌刊登出一篇文章,綜合了兩份關於文學作品的研究報告。
這兩個研究都是用數學方法去分析文學,這種理性和感性的碰撞研究,
得出的結果非常有意思。下面給你具體說說。
首先,原來小說中的情感走勢和悲喜變化,都是有套路的,
而且只要六種套路就能基本概括。美國佛蒙特大學做了一項研究,
他們從世界上第一個數字圖書館計劃“古登堡計劃”中,
選取了1327部10萬字以下的英文虛構小說,然後將小說的情緒變化可視化,
也就是根據所用詞語的情緒高低,
或者說悲喜程度,畫出了小說從開篇到結尾的情感走勢圖。
這一千多本小說的走勢圖畫下來,他們就發現,其中有大約85%的小說,
它們的情感走勢都屬於以下六個類型之一:
第一種被稱為“麻雀變鳳凰”型,
情感走勢圖是一條從低到高上揚的弧線,就是開頭悲苦、結尾喜悅;
第二種是典型的悲劇型,弧線從高滑到低,意味著喜劇開頭、悲劇結尾;
第三種,是兩頭高中間低,形成一個U形,
就是開頭喜悅,中間經歷了悲慘,最後再歡喜收尾;
第四種和第三種相反,是兩頭低、中間高的拱橋狀,
意思是悲傷開頭,中間歡喜,結尾再跌回到悲傷;
第五種就像大寫的英文字母N,從低處開始,經歷一起一落,最後再升高,喜劇收尾;
第六種又和第五種相反,一開始就在高昂的情緒上,先降再升再降,最後悲劇結尾。
佛蒙特大學的研究人員把這三對大致兩兩相對稱的弧線,稱作小說的“情感弧線”。
可別小看這六條簡單的弧線,大量數據就擺在這裡了,絕大多數小說都跳不出這六種套路。
關於小說的數學規律,還有另外一個有意思的研究,來自波蘭的核物理研究院。
你看,核物理研究院來研究文學,本身就夠有趣的吧。
他們選取了113部由不同語言寫成的文學名著,從頭到尾分析它們的句子長短排列,
並根據句子的長度畫出了柱狀圖。他們觀察這些密密麻麻排列的柱子,
看它們的波動規律,發現這些統計圖經常能形成分形圖案。
什麼叫分形圖案呢?
簡單說來,就是一個整體的幾何形狀,它由好幾個小部分組成,
這些小部分的形狀跟整體的形狀一樣,或者至少是非常類似。
我們舉個例子,一棵西蘭花,你掰下其中一小朵,
會發現這朵西蘭花的形狀跟整棵西蘭花很像,再從這一小朵上掰下更小的分支來看看,
它的形狀還是像整棵西蘭花。分形圖案就類似這樣,一層一層地嵌套下去。
在這個研究中,統計圖形成了分形圖案,這意味著什麼呢?
比如說,一篇小說的句子長短排列順序整體呈現出了一種規律,
我們放大一點看其中的某一章,這一章的句子長短也呈現同樣的規律,
再從這一章裡面挑一節來看,這一節的句子長短還是差不多的規律。
而且,意識流小說和傳統類小說還不一樣,
意識流小說的統計圖呈現出了更加明顯的分形圖案,
也就是說,意識流小說更符合這個特點,而傳統小說的特點就沒有那麼明顯。
你要問了,我們用數學方法研究文學有什麼用呢?
佛蒙特大學的研究人員說,通過研究人類基因組計劃中的海量數據,
人類已經發現了大量前所未知的、關於基因的知識,那麼同理,
用提取數據、理性分析的方法來研究文學,或許也能發現更多關於文學作品的秘密。
以上就是文學作品中的數學規律新發現,供你參考。
本文源自:《科學美國人(Scientific American)》2017年2月刊 Great Literature Is Surprisingly Arithmetic
稿:王巧穎
轉載:得到
-------------------
主旨:
美國佛蒙特大學做了一項研究,他們從世界上第一個數字圖書館計劃“古登堡計劃”中,
選取了1327部10萬字以下的英文虛構小說,然後將小說的情緒變化可視化,
也就是根據所用詞語的情緒高低或說悲喜程度,畫出了小說從開篇到結尾的情感走勢圖。
這一千多本小說的走勢圖畫下來,他們就發現,其中有大約85%的小說,
它們的情感走勢都屬於以下六個類型之一:
第一種被稱為“麻雀變鳳凰”型,
情感走勢圖是一條從低到高上揚的弧線,就是開頭悲苦、結尾喜悅;
第二種是典型的悲劇型,弧線從高滑到低,意味著喜劇開頭、悲劇結尾;
第三種,是兩頭高中間低,形成一個U形,
就是開頭喜悅,中間經歷了悲慘,最後再歡喜收尾;
第四種和第三種相反,是兩頭低、中間高的拱橋狀,
意思是悲傷開頭,中間歡喜,結尾再跌回到悲傷;
第五種就像大寫的英文字母N,從低處開始,經歷一起一落,最後再升高,喜劇收尾;
第六種又和第五種相反,一開始就在高昂的情緒上,先降再升再降,最後悲劇結尾。
佛蒙特大學的研究人員把這三對大致兩兩相對稱的弧線,稱作小說的“情感弧線”。
可別小看這六條簡單的弧線,大量數據就擺在這裡了,絕大多數小說都跳不出這六種套路。
關於小說的數學規律,還有另外一個有意思的研究,來自波蘭的核物理研究院。
你看,核物理研究院來研究文學,本身就夠有趣的吧。
他們選取了113部由不同語言寫成的文學名著,從頭到尾分析它們的句子長短排列,
並根據句子的長度畫出了柱狀圖。他們觀察這些密密麻麻排列的柱子,
看它們的波動規律,發現這些統計圖經常能形成分形圖案。
在這個研究中,統計圖形成了分形圖案,這意味著什麼呢?
比如說,一篇小說的句子長短排列順序整體呈現出了一種規律,
我們放大一點看其中的某一章,這一章的句子長短也呈現同樣的規律,
再從這一章裡面挑一節來看,這一節的句子長短還是差不多的規律。
而且,意識流小說和傳統類小說還不一樣,
意識流小說的統計圖呈現出了更加明顯的分形圖案,
也就是說,意識流小說更符合這個特點,而傳統小說的特點就沒有那麼明顯。
你要問了,我們用數學方法研究文學有什麼用呢?
佛蒙特大學的研究人員說,通過研究人類基因組計劃中的海量數據,
人類已經發現了大量前所未知的、關於基因的知識,那麼同理,
用提取數據、理性分析的方法來研究文學,或許也能發現更多關於文學作品的秘密。
這條音頻跟你說一說,我們讀的那些小說,在感性的文字背後,
還隱藏著怎樣的數學規律和理性之美。
今年2月份的《科學美國人》雜誌刊登出一篇文章,綜合了兩份關於文學作品的研究報告。
這兩個研究都是用數學方法去分析文學,這種理性和感性的碰撞研究,
得出的結果非常有意思。下面給你具體說說。
首先,原來小說中的情感走勢和悲喜變化,都是有套路的,
而且只要六種套路就能基本概括。美國佛蒙特大學做了一項研究,
他們從世界上第一個數字圖書館計劃“古登堡計劃”中,
選取了1327部10萬字以下的英文虛構小說,然後將小說的情緒變化可視化,
也就是根據所用詞語的情緒高低,
或者說悲喜程度,畫出了小說從開篇到結尾的情感走勢圖。
這一千多本小說的走勢圖畫下來,他們就發現,其中有大約85%的小說,
它們的情感走勢都屬於以下六個類型之一:
第一種被稱為“麻雀變鳳凰”型,
情感走勢圖是一條從低到高上揚的弧線,就是開頭悲苦、結尾喜悅;
第二種是典型的悲劇型,弧線從高滑到低,意味著喜劇開頭、悲劇結尾;
第三種,是兩頭高中間低,形成一個U形,
就是開頭喜悅,中間經歷了悲慘,最後再歡喜收尾;
第四種和第三種相反,是兩頭低、中間高的拱橋狀,
意思是悲傷開頭,中間歡喜,結尾再跌回到悲傷;
第五種就像大寫的英文字母N,從低處開始,經歷一起一落,最後再升高,喜劇收尾;
第六種又和第五種相反,一開始就在高昂的情緒上,先降再升再降,最後悲劇結尾。
佛蒙特大學的研究人員把這三對大致兩兩相對稱的弧線,稱作小說的“情感弧線”。
可別小看這六條簡單的弧線,大量數據就擺在這裡了,絕大多數小說都跳不出這六種套路。
關於小說的數學規律,還有另外一個有意思的研究,來自波蘭的核物理研究院。
你看,核物理研究院來研究文學,本身就夠有趣的吧。
他們選取了113部由不同語言寫成的文學名著,從頭到尾分析它們的句子長短排列,
並根據句子的長度畫出了柱狀圖。他們觀察這些密密麻麻排列的柱子,
看它們的波動規律,發現這些統計圖經常能形成分形圖案。
什麼叫分形圖案呢?
簡單說來,就是一個整體的幾何形狀,它由好幾個小部分組成,
這些小部分的形狀跟整體的形狀一樣,或者至少是非常類似。
我們舉個例子,一棵西蘭花,你掰下其中一小朵,
會發現這朵西蘭花的形狀跟整棵西蘭花很像,再從這一小朵上掰下更小的分支來看看,
它的形狀還是像整棵西蘭花。分形圖案就類似這樣,一層一層地嵌套下去。
在這個研究中,統計圖形成了分形圖案,這意味著什麼呢?
比如說,一篇小說的句子長短排列順序整體呈現出了一種規律,
我們放大一點看其中的某一章,這一章的句子長短也呈現同樣的規律,
再從這一章裡面挑一節來看,這一節的句子長短還是差不多的規律。
而且,意識流小說和傳統類小說還不一樣,
意識流小說的統計圖呈現出了更加明顯的分形圖案,
也就是說,意識流小說更符合這個特點,而傳統小說的特點就沒有那麼明顯。
你要問了,我們用數學方法研究文學有什麼用呢?
佛蒙特大學的研究人員說,通過研究人類基因組計劃中的海量數據,
人類已經發現了大量前所未知的、關於基因的知識,那麼同理,
用提取數據、理性分析的方法來研究文學,或許也能發現更多關於文學作品的秘密。
以上就是文學作品中的數學規律新發現,供你參考。
本文源自:《科學美國人(Scientific American)》2017年2月刊 Great Literature Is Surprisingly Arithmetic
稿:王巧穎
轉載:得到
-------------------
主旨:
美國佛蒙特大學做了一項研究,他們從世界上第一個數字圖書館計劃“古登堡計劃”中,
選取了1327部10萬字以下的英文虛構小說,然後將小說的情緒變化可視化,
也就是根據所用詞語的情緒高低或說悲喜程度,畫出了小說從開篇到結尾的情感走勢圖。
這一千多本小說的走勢圖畫下來,他們就發現,其中有大約85%的小說,
它們的情感走勢都屬於以下六個類型之一:
第一種被稱為“麻雀變鳳凰”型,
情感走勢圖是一條從低到高上揚的弧線,就是開頭悲苦、結尾喜悅;
第二種是典型的悲劇型,弧線從高滑到低,意味著喜劇開頭、悲劇結尾;
第三種,是兩頭高中間低,形成一個U形,
就是開頭喜悅,中間經歷了悲慘,最後再歡喜收尾;
第四種和第三種相反,是兩頭低、中間高的拱橋狀,
意思是悲傷開頭,中間歡喜,結尾再跌回到悲傷;
第五種就像大寫的英文字母N,從低處開始,經歷一起一落,最後再升高,喜劇收尾;
第六種又和第五種相反,一開始就在高昂的情緒上,先降再升再降,最後悲劇結尾。
佛蒙特大學的研究人員把這三對大致兩兩相對稱的弧線,稱作小說的“情感弧線”。
可別小看這六條簡單的弧線,大量數據就擺在這裡了,絕大多數小說都跳不出這六種套路。
關於小說的數學規律,還有另外一個有意思的研究,來自波蘭的核物理研究院。
你看,核物理研究院來研究文學,本身就夠有趣的吧。
他們選取了113部由不同語言寫成的文學名著,從頭到尾分析它們的句子長短排列,
並根據句子的長度畫出了柱狀圖。他們觀察這些密密麻麻排列的柱子,
看它們的波動規律,發現這些統計圖經常能形成分形圖案。
在這個研究中,統計圖形成了分形圖案,這意味著什麼呢?
比如說,一篇小說的句子長短排列順序整體呈現出了一種規律,
我們放大一點看其中的某一章,這一章的句子長短也呈現同樣的規律,
再從這一章裡面挑一節來看,這一節的句子長短還是差不多的規律。
而且,意識流小說和傳統類小說還不一樣,
意識流小說的統計圖呈現出了更加明顯的分形圖案,
也就是說,意識流小說更符合這個特點,而傳統小說的特點就沒有那麼明顯。
你要問了,我們用數學方法研究文學有什麼用呢?
佛蒙特大學的研究人員說,通過研究人類基因組計劃中的海量數據,
人類已經發現了大量前所未知的、關於基因的知識,那麼同理,
用提取數據、理性分析的方法來研究文學,或許也能發現更多關於文學作品的秘密。
沒有留言:
張貼留言