APP下载

20世纪初中国歌曲数据分析

2021-04-09王轶中邵勇苏铂砚

音乐天地(音乐创作版) 2021年1期
关键词:语音能量词汇

文/王轶 中邵勇 苏铂砚

1.引言

音乐作品以声音为表现手段,是声音的艺术。任何音乐所发出的声音,都是经过作者精心思考后创作出来的,渗透着作者的创作思想与灵感。音乐的创作和表现,离不开文化和当时的社会背景。古往今来,音乐都在不断诉说着不同时代人们的声音。古有迁客骚人借用诗词歌曲表达自己怀才不遇之情;今有各路rapper 用说唱抒发自己价值观念。人们常常将自己的情感置于歌曲之中,因此词曲能反应当时人们的情绪。

20世纪初的中国,经历了半殖民地半封建社会、旧民主主义革命时期、新民主主义革命时期,中华民族处在民族存亡的危急关头。期间发生了很多重大的历史事件,比如1911年辛亥革命,1912年中华民国成立,1919年五四运动,1921年中国共产党成立,1927年“四·一二”政变等,这些大事件对1949年新中国成立及发生的一系列变化产生了巨大的影响。由于特殊的历史年代,这一时期的音乐家创作的歌曲具有较高的艺术价值和深刻的思想内涵,歌曲从不同角度宣扬了反帝爱国的思想和五四新文化运动所倡导的民主科学精神,这一时期是中国艺术歌曲形成和发展的重要阶段,在中国艺术歌曲发展史上有着非常重要的地位。本文选取了1900-1930年的14 首代表性歌曲,每一首都带着时代的烙印,对这些歌曲进行大数据研究分析,意图用这些歌曲去探寻那个时代的主旋律,并诠释在中国音乐发展史上具有重要地位的原因。

2.研究方法

2.1.歌曲的选择

选取20世纪初期著名音乐家的14 首代表性歌曲,包括:沈心工的《黄河》(1905)、李叔同的《春游》(1931)、《送别》(1915)、黎锦晖的《可怜的秋香》(1921)、《总理纪念歌》(1925)、《毛毛雨》(1927)、《桃花江》(1928)、《特别快车》(1929)、赵元任的《卖布谣》(1922)、《教我如何不想他》(1926)、萧友梅的《问》(1922)、陈啸空的《湘累》(1924)、孙瑜的《万里寻兄词》(1930)、青主的《我住长江头》(1930)。

2.2.整体研究

下载并提取14 首歌曲的音频文件和全歌歌词(数据采集),运用 MATLAB、Python 编程软件及Word2Vec 训练模型,分析曲调旋律(即语音信号的时域特性)和歌词特征,在编程软件中对数据进行可视化处理,得出曲调旋律的波形图和歌词的分布结果,分析歌曲的艺术性及时代特征。

2.2.1 曲调旋律分析

选取样本歌曲,针对样本歌曲的旋律语音信号,利用旋律的短时能量和短时平均过零率两项数据的相关知识,建立波形图研究方法,即将样本歌曲的音频文件输入MATLAB 中,编程输出得到相对准确的样本歌曲的语音波形、短时能量波形以及短时平均过零率波形图,以此可视化数据分析总结歌曲的艺术特点。

2.2.2 歌词分析

针对样本歌曲的歌词,建立Word2Vec 训练模型,在Python 中输入14 首歌曲的完整歌词,对其进行提取、分词、向量化处理,得到14 首歌中出现频率最高的词汇,在该模型中用模拟得出高频歌词的相关词汇,根据相关词汇分析总结歌曲的时代特点。

2.3 软件的选择

选取软件MATLAB、Python 进行数据分析,并对数据进行编程求解,分析数据。

2.3.1 曲调旋律部分采用MATLAB 的语音信号的时域特性分析——短时能量、短时平均过零率两项数据分析,利用最终得出的音频数据分析不同歌曲的特征。

2.3.2 歌词部分采用Word2Vec 训练模型,在Python 上将词汇转换成向量形式,并以词汇作为样本进行构建和训练,有助于分析歌曲的时代特征。

2.4 研究假设

(1)所有数据均为原始数据,来源真实可靠。

(2)将每首歌的音频剪辑下来,保存为wav 格式,录入MATLAB 进行读取。

(3)每首歌曲的剪辑音频均为歌曲全曲,以确保特征分析的真实性、完整性。

(4)对于语音信号中的平均短时过零率,因为噪音环境与清音难以分辨,所以假设排除了所有的噪音干扰。

(5)对于歌词分析得出的相关词汇,认为其较为具有相关性,以此进行分析总结。

3.研究过程

3.1 语音信号的时域特性分析(曲调旋律分析)

3.1.1 短时能量介绍

由于语音信号是随时间变动的非平稳随机过程,因此在对语音分析中可采用短时分析的方法。语音虽然是时变的然而具备短时相关性,这个相关性来源于人体发出声音的器官具有惯性,因而语音的状态不会发生渐变,在短时间内语音信号的共性不会有较大变化,称之为语音的短时平稳性,在这短时的稳定性中包含的能量就叫短时能量。

3.1.2 短时能量提取

短时能量可以通过下面公式来计算:

3.1.3 过零率介绍

过零率是指在每帧中,语音信号通过零点的次数,也就是信号在正负间变换的次数。

3.1.4 过零率计算

其中S 是采样点的值,T 为帧长,函数π{A}在A 为真时值为1,否则为0。

3.1.5 读取歌曲数据

我们在14 首歌曲中选取了6 首作为分析样本,将它们的音频保存为wav 格式,之后在MATLAB 中读取运行,运行程序后得出的语音波形和短时能量图如图所示:

3.1.6 曲调旋律总体分析

通过对6 首歌曲语音波形、短时能量和短时平均过零率图的数据分析,得出歌曲的曲调旋律总体分析:

(1)除了《我住长江头》外,几乎所有样本歌曲的平均音调都较高,存在低音部分也占少量时长,副歌以高音为主,可以在一定程度上认定该时代的歌曲大多数以积极的情绪为主基调,结合时代背景分析,这些歌曲可能是为了唤醒大众、增强民族凝聚力,给予人们坚持不懈、奋起抗争的勇气和信心。

(2)大部分歌曲的平均短时能量都较高,即使像《送别》存在大段短时能量较低时刻的歌曲也有短时能量爆发的副歌时刻,可以认定所选歌曲的整体声音变化都较为剧烈,结合时代背景分析,那时候大部分歌曲很可能是为了鼓舞人心、激励人们以积极乐观的态度面对压迫和困难。

(3)短时平均过零率呈现出与短时能量类似的情况,大部分歌曲短时平均过零率较高,此项数据主要是为了进行端点检测,尤其是用来检测清音的起止点,对于情感分析帮助不大,但是有助于我们分析歌曲结构。

(4)我们不难发现,样本歌曲全部具有一定的周期性,可以认定上世纪初的歌曲有大量重复段落。分析原因如下:一是为了增强节奏感,唱起来使人感到亲切、流畅和纯朴;二是为了突出主题思想,有利于抒发作者的情感,增强作品的感染力,更好的唤醒大众以坚韧的精神去面对艰难困苦并与列强抗争。

3.2 歌词分析

3.2.1 模型思想

运用Word2Vec 将词语编码映射到一个新的多维空间,在这个新的空间中,词义相近的词会有相近的位置,并且最终形成稠密矩阵。选取其中的Skip-gram 模型,提取出14 首歌曲中的20 个高频词汇,输入计算他们的相关词汇,寻求歌曲特征。

3.2.2 处理并读取歌词数据

(1)将歌词提取出并进行分词处理,之后将这些歌词进行向量化处理,以便在之后的分析中利用研究词汇之间的相关性,最后计算并提取14 首歌曲中20 个出现最高频的词汇,如下图

(2)选取其中几个情感偏向较为明显的词汇(其中包含一个不属于出现频率前20 名的词“纪念”作为对比),输入到Skip-gram模型当中,推测它们的原始语境(相关词汇),结果如下图

前20 名中出现频率最高的为“秋香”(11 次),出现频率最低的为“夕阳”(4 次)。

与“秋香”最相关的词有“财主”“哈”“血如花”“疏钟”“好”;与“我们”最相关的词有“埋怨”“微风细雨”“华年”“垂”“腮”;与“可怜”最相关的词有“从”“他”“梅花”“牺牲”“张开”;与“不要”最相关的词有“一见”“君”“都”“一点儿”“繁华”;与“不想”最相关的词有“饿倒”“挨”“麻烦”“又”“匀”;与“纪念”最相关的词有“知不知道”“推翻”“地之角”“挨”“民主”(所有相关词与原词汇均来自于同一首歌)。

3.2.3 歌词结果分析

我们首先分析所有歌曲的总体歌词,总结出20世纪初期的歌曲大致可以分为民族爱国、苦难抗争、歌颂爱情、展现生活四个主题。

(1)“军伍”“革命”“血如花”“民主”等词,营造了一种宏伟的氛围,将当时中国的艰难处境、人民在苦难中坚持不懈地反抗以及革命的主题融合在一起,歌曲中的这一系列歌词激励着人们,给予人们不愿低头、反抗压迫的力量。

(2)“桃花”“恋爱”“蜜”等词,以一些生活中平淡又使人心情愉悦的词营造出一种欢快的氛围,这些词语符合当时人们对于美好爱情的期盼,且赞美女性、赞美爱情的语句毫不遮遮掩掩,让人们能够感同身受地体会到对爱情和生活的美好向往。

(3)“盛会”“饮酒”“卖补”“补裤”等一系列表现生活状态的词语显示出了两种截然相反的生活状态,一边是宴会上的欢歌笑语,一边则是为生计发愁的贫困生活。通过描写人们不同的生活状况,把宴会的欢快舞动氛围和底层人民的艰苦生活状态描绘的淋漓尽致,表现出当时社会贫富差距过大等现状,更表达了对劳动人民生活艰辛的同情之心。

(4)“毛毛雨”“微风”“黄河”“春风”“梨花”等词,都是歌曲的景物主题或衬托景象,歌曲借景抒情,对于毛毛雨、黄河、春日等景象的描绘生动又引人入胜,在赞美大自然的同时抒发了作者的真挚情感,表达了作者对祖国山河的热爱和对自由爱情的追求。

4.结论

4.1 运用数学软件和模型研究,可以分析歌曲的艺术性和时代特征。本研究运用 MATLAB、Python 编程软件及Word2Vec 训练模型,对采集歌曲的曲调旋律的波形图和歌词的分布位置研究,可以较为科学、真实的分析歌曲的艺术性和时代特征。

4.2 总结20世纪初中国歌曲的艺术性和特征。根据歌曲的数据研究结果,结合时代背景,20世纪初中国歌曲总体有以下几个方面的特点:

(1)开创了中国新音乐创作的先河。这一时期的音乐家绝大多数是留洋归国的,在音乐创作时借鉴、运用西洋作曲的技术和方法,歌曲的有些曲调带有强烈的外来色彩,歌词则带有浓郁的旧体诗词的韵调,洋为中用,古为今用,使外来文化和中国民族传统文化得到完美的结合,推动了学堂乐歌及中国近现代音乐文化的发展,宣告了一个新的音乐时代的到来。

(2)题材广泛。歌曲涵盖了田园风光、美好爱情、怀念亲友、歌颂伟人、爱国忧国、苦难抗争、展现生活等题材,符合人们多样化的兴趣爱好,深受广大民众的喜爱,表现出当时音乐家深厚的文化底蕴和音乐素养。

(3)乐观积极。在江河破碎的沉闷年代,音乐家仍然对祖国的未来充满希望、对生活充满期待,他们歌颂爱情、赞美山水田园,表达了人们对美好生活的向往。

(4)爱国忧国。当时的中国,外有帝国主义的欺凌压榨,内有军阀连年混战,人民遭受着无比深重的灾难。音乐家们受“五四”新文化运动的影响,思想积极,在民族存亡的危机时刻,不忘用音乐唤醒民众,用歌声号召百姓,增强爱国救国的民族意识和凝聚力,鼓励国人对侵略者和军阀的残酷压迫奋起反抗、勇敢战斗,表现出知识分子强烈的爱国情怀、抗击侵略者的迫切愿望和中国人民必胜的坚定信心。

4.3 分析歌曲的意义。上述歌曲的特点表明,20世纪初音乐家创作的歌曲体现了鲜明的民族特色和独特的时代特征,具有较高的艺术价值和深刻的思想内涵,这一时期成为中国艺术歌曲形成和发展的重要阶段,在中国歌曲发展史上具有非常重要的地位,也是世界音乐文化的瑰宝。

5.思考

(1)众所周知,音乐更多的是感性,是心灵和情感在声音方面的外化,数学更多的是理性,是事物高度抽象和逻辑思维的产物。通过本研究我们发现,丰富、有趣、充满情感的感性音乐与单调、枯燥、冷漠的理性数学之间存在着密切关系的,他们用不同的方式来描述世间万物,互相渗透,互相促进,体现了音乐和数学都能描述和揭示自然界和谐统一的规律。感性的音乐中处处闪现着理性的数学的影子。

(2)通过对大量数据的研究分析发现,在当今计算机和信息技术飞速发展的时代,可以尝试用数学软件对最受公众欢迎的各类型歌曲进行分析比对,模仿创作出更多类似元素的歌曲,以更好的满足广大消费者的不同需求。我们期待大数据为音乐创作提供更广阔的平台,为传统的音乐创作转型升级为互联网+音乐创作奠定坚实的基础。我们相信在未来的音乐事业中,数学将会发挥越来越重要的作用。(作者单位:西北大学)

猜你喜欢

语音能量词汇
正能量
魔力语音
基于MQ3与MP3的价廉物美的酒驾语音提醒器
数字滤波在语音信号降噪中的应用
对方正在输入……
诗无邪传递正能量
词汇小达人
词汇小达人
词汇小达人
词汇小达人