极品人生

标题: alma专栏《声音》四:声音的客观性 [打印本页]

作者: alma    时间: 2013-5-30 01:47
标题: alma专栏《声音》四:声音的客观性
本帖最后由 alma 于 2013-6-3 01:55 编辑

声音当然有客观性,因为声音本质上可以用物理量来表示。但是显然我们谈的不是这些物理量,而是古典乐中的声音,有哪些客观的地方。一周前,学院的西班牙和德国的研究生在我的办公室里做了个实验,她们用发令枪作为声音刺激,以声音测试仪作为评价工具,测出我办公室里的声音混响时间,结果当然与不同频率的声音有关,混响时间也因为不同频率而不同,我记得500hz声音的混响时间,我的办公室是1.03秒。这当然是一个很简单的测量。

最近豆友做了一个非常简单的声音测试,可以测出各种不同音乐类型的频谱取向,这个实验很有意思,我们可以发现古典乐与其他音乐声音的巨大差异。实验中的音乐类型的选取分别是:

拉三第三乐章,
Elliott Smith - Between The Bars
条纹Seven Nation Army
Portishead - Glory Box
NIN - Mr. Self-Destruct
MBV - She Found Now
A Place To Bury Strangers - Deadbeat


这个实验的具体请看这里:高科技地告诉你各音乐类型的区别  http://www.douban.com/note/264690600/
在这个实验中,我们可以看到古典音乐的声音走向,与ambient音乐的走向比较接近,而与其他音乐类型的走向大相径庭。如果你仔细观察一下这些声音频谱的话,你会发现古典和ambient声音是一种有规律的有节奏变化的弹性声音。

我们缺少对声音客观性的测量工具,这是我想说的话。如果我们要强调声音的客观性,偶们需要一种非常理性与一定敏锐度的测量工具。但是,当我们将声音还原到一些物理量变化形态的时候,我们又会陷入另一个误区。我建议的是对声音认知的测量,也就是把声音的认知通过一些精心设计的量表来测试。关于这个事情,我手上就有一本书,关于声音的心理学评价。放在案头多时,我却没有时间看她。












作者: Rozinante    时间: 2013-5-30 02:29
豆瓣那个实验里几种音乐的时长不一样。古典16分钟,Ambient只有4分钟;把长度统一了,两者的差异会更明显。

当然,这跟alma说的主题似乎没有关系。我想这种实验大概属于alma说的“当我们将声音还原到一些物理量变化形态的时候,我们又会陷入另一个误区”。
作者: alma    时间: 2013-5-30 02:32
豆瓣那个实验里几种音乐的时长不一样。古典16分钟,Ambient只有4分钟;把长度统一了,两者的差异会更明显。 ...
Rozinante 发表于 2013-5-30 02:29


你说的有道理,我也不太清楚它们是否在一个标准时间段落中被测量的。


作者: Rozinante    时间: 2013-5-30 02:34
你说的有道理,我也不太清楚它们是否在一个标准时间段落中被测量的。
alma 发表于 2013-5-30 02:32


图上有坐标啊。
作者: alma    时间: 2013-5-30 02:36
图上有坐标啊。
Rozinante 发表于 2013-5-30 02:34


你提醒我了,我们是否可以将这些音乐类型还原到一个标准的时间段落。我觉得,一个舒存老师很关心的问题:声音密度,是否可以测量?



作者: Rozinante    时间: 2013-5-30 02:43
你提醒我了,我们是否可以将这些音乐类型还原到一个标准的时间段落。我觉得,一个舒存老师很关心的问题 ...
alma 发表于 2013-5-30 02:36


放大到一秒钟,也许可以看出来什么叫“声音的密度”。我瞎猜的。
作者: Jwang    时间: 2013-5-30 08:23
本帖最后由 Jwang 于 2013-5-30 08:25 编辑

这个很没道理。

声音作为一个物理现象不用讲就具备客观性。而音乐不是,尽管音乐要用声音这个客观物理要素。就象绘画一样,要用颜料等客观物理要素,但绘画作为一种艺术品不是客观。

看看这是什么音乐?但白讲这个实验不表明任何东西。

[attach]71065[/attach]
作者: 牛仔    时间: 2013-5-30 08:29
一个是真实的乐器,一个是插电器材。
一个无法音量调整,一个可随意调整。
环境对现场不插电声音影响是巨大的,但对立体声录音重播影响就有限了
作者: Jwang    时间: 2013-5-30 10:02
关于声音的密度我以前思考过。声音的密度应定义为一种声音包含的信息量。既相对熵的慨念。相对熵是指Kullback–Leibler divergence。它的本意是指一个真实的概率分布, p(X),然后有个随意arbitrary的概率分布q(X)。这个q(X)在一定程度上反映了真实的概率分布, p(X)。然后经过对q(X)的压缩和调整,这里有数据来表明这种调节的程度。再下去,不行了,呵。我不是搞信息的。

从概念上来讲,一个乐器有其真实的质地和音色等, p(X)。在音响重播中,一个重播的声音q(X)中,这个声音在多大程度表达了真实的声音就是个密度量。这个重播的声音是个对原始乐器的信息量反映多少的指标。

作者: Rozinante    时间: 2013-5-30 10:31
关于声音的密度我以前思考过。声音的密度应定义为一种声音包含的信息量。既相对熵的慨念。相对熵是指Kullba ...
Jwang 发表于 2013-5-30 10:02


首先,原始声音p(X)本身就有密度高低的问题。alma的意思就是,古典音乐的声音密度高,摇滚乐虽然响但密度低。

其次,这个相对熵在这里用反了:p(X)和q(X)越接近(即在Jwang兄这个模型里,录音越接近真实),相对熵就越小;理想情况是相对熵为零。
作者: rock    时间: 2013-5-30 10:43
首先,原始声音p(X)本身就有密度高低的问题。alma的意思就是,古典音乐的声音密度高,摇滚乐虽然响但密 ...
Rozinante 发表于 2013-5-30 10:31


有时大家讲的"密度" 与电声学的"密度"不一样...

作者: Rozinante    时间: 2013-5-30 11:04
有时大家讲的"密度" 与电声学的"密度"不一样...
rock 发表于 2013-5-30 10:43


呵呵,我当然知道这里说的不是电磁场的密度。Jwang兄提出了一种衡量发烧友所说的“密度”的方法,而我的意思是这种方法行不通。
作者: rock    时间: 2013-5-30 11:12
发烧友讲的"密度",与系统频宽/环境/系统功率/喇叭/心理 等等都相关....难以有统一而简单的衡量标准.
作者: 甲米    时间: 2013-5-30 12:01
Focus: Sweet Music to your Nerves
Published September 2, 2011  |  Phys. Rev. Focus 28, 9 (2011)  |  DOI: 10.1103/PhysRevFocus.28.9

A theoretical model of neurons associated with hearing may explain why certain note combinations are more pleasing than others. New research supports the theory by quantifying the effect.
The most pleasing musical chords have simple mathematical relationships between the different sound frequencies within them, but the source of this perception is mysterious. A recent mathematical model suggests that the key may be the rhythmically consistent firing of neurons in response to a harmonious pair of frequencies. Now the researchers who developed the model report 2 September in Physical Review Letters that they have quantified the effect by calculating the information content of their model’s neural signals and showed that it increases for tone pairs that are more pleasant sounding. The model may also provide insights into other sensations besides hearing.


Going back to Pythagoras in 500 BCE, people have noticed that pairs of notes with simple frequency ratios, such as tones separated by an octave (2:1) or a perfect fifth (3:2), produce a more tranquil sound than, say, a minor second (16:15). Hearing the difference doesn’t require musical training, as even infants and animals respond to it. Recent research suggests that the sensation of harmony, or “consonance,” is not simply the result of the way sound waves combine; it arises from the processing of sound into electrical signals. “The behavioral preference of consonant chords is due to some basic principles of neural functionality,” says Bernardo Spagnolo of the University of Palermo in Italy.
Some physicists have tried modeling some rather complex neural “circuits,” but Spagnolo and his colleagues have restricted themselves to a simple three-neuron system that likely reflects the way neural signals travel from the ear to the brain. Two of the neurons are considered “sensory” neurons, each of which is stimulated by a different audio frequency in the inner ear. These two neurons send their electrical signals into a third, so-called “interneuron,” which sends a signal to the brain.
In their mathematical model, each neuron obeys the well-known “leaky integrate-and-fire” equations, in which incoming stimuli drive up the voltage across the neural membrane until it reaches some threshold, at which point the neuron fires a voltage spike. After firing, the voltage resets to some initial value, but the neuron must wait a short period before it can fire again. This “down-time” results in a kind of interference: if the two sensory neurons fire at around the same time, then the interneuron will only be able to relay one spike instead of two.
In a previous paper, the researchers calculated the interneuron’s firing statistics for consonant and dissonant inputs in the presence of additional “noise,” representing random signals from other, nearby neurons [1]. If the two sensory neurons were excited by a consonant pair of tones, the interneuron fired in well-spaced time intervals. But the firing pattern turned erratic when the pair of audio frequencies was dissonant.
These results, however, were not quantitative–there was no precise mathematical definition to distinguish “orderly” signals from erratic ones–which made it difficult to draw more general conclusions or apply the results to neurological data. Now the team has reanalyzed the results using information theory, which says that the less random a signal is, the more information it contains. They devised a precise measure, called regularity, which reflects this information content. Their theoretical and numerical calculations show that consonant notes produce higher regularity (or greater information) in the interneuron signal than do dissonant notes.
The regularity also behaves like a well-known psychological effect involving the perceived pitch. When subjects listen to a combination of two pure notes, they report hearing a low frequency that isn’t physically present in the sound waves. This perceived pitch increases with the ratio of the two frequencies, just as the regularity does. Spagnolo and his colleagues take this similarity as evidence that their model is capturing some hidden aspect of how sound is processed in our heads.
“This is progress,” says André Longtin of the University of Ottawa in Canada. “But I wouldn’t say that it has nailed the problem shut.” Dante Chialvo of UCLA says this is the first time that the physics and biology of neurons have been put together in a verifiable theory. Because the present model is so generic, he thinks it might apply to neurons tied to other senses. “If these authors are correct, then the basic mechanism of consonance is universal and has little to do with our ears,” Chialvo says.
–Michael Schirber
Michael Schirber is a freelance science writer in Lyon, France.


作者: 甲米    时间: 2013-5-30 12:03
Phys. Rev. E 81, 041911 (2010) [13 pages] Spike train statistics for consonant and dissonant musical accords in a simple auditory sensory model
The phenomena of dissonance and consonance in a simple auditory sensory model composed of three neurons are considered. Two of them, here so-called sensory neurons, are driven by noise and subthreshold periodic signals with different ratio of frequencies, and its outputs plus noise are applied synaptically to a third neuron, so-called interneuron. We present a theoretical analysis with a probabilistic approach to investigate the interspike intervals statistics of the spike train generated by the interneuron. We find that tones with frequency ratios that are considered consonant by musicians produce at the third neuron inter-firing intervals statistics densities that are very distinctive from densities obtained using tones with ratios that are known to be dissonant. In other words, at the output of the interneuron, inharmonious signals give rise to blurry spike trains, while the harmonious signals produce more regular, less noisy, spike trains. Theoretical results are compared with numerical simulations.



作者: 牛仔    时间: 2013-5-30 12:49
又是一大堆“鸡肠”,有拿虎皮扯大旗嫌疑
作者: metamophore    时间: 2013-5-30 20:47
如果古典乐真的走进这类声学实验的象牙塔尖的话,那古典乐的受众就更小众了又小众了,甚至于我也将排斥古典乐。
实验室内测试这些数据的结论,绝不会引申出任何有价值的实际聆听结论和价值取向。
21世纪医学的一大发展将会是转化医学的蓬勃壮大,何谓转化医学,即将基础医学领域的研究成果转化为临床实践和临床成果,这是一个富有使命感的学科。
而上述这些声学实验最终转化为古典乐的创作和欣赏之途在哪里?我看不出。
为形而上而形而上,或为形而上穿上魅力惑众的有形外衣,误入歧途了吧?
作者: Rozinante    时间: 2013-5-30 22:04
为形而上而形而上,或为形而上穿上魅力惑众的有形外衣,误入歧途了吧?
metamophore 发表于 2013-5-30 20:47


这清清楚楚明明白白是“形而下”,是纯技术的探讨嘛。认为声音密度是完全抽象的概念,才是“形而上”的观点。

如果搞这个东西,那纯属自己觉得好玩儿,对其他爱好者欣赏音乐有什么影响呢?难道因为有人花了八年用没人能看懂的方法证明了存在无穷多个差小于七千万的素数对,我们就都愤怒地从小学开始抵制数学了?
作者: Rozinante    时间: 2013-5-30 22:07
甲米  发表于 10 小时前
是信息熵吧,看看能不能用最大熵原理来分析分析?
--------------------------------
这个太简单了,熵最大的信号就是白噪声。甲米兄觉得那玩意儿密度高不?
作者: Jwang    时间: 2013-5-30 22:07
甲米兄转的这片文章很有意思。记的我以前讲过,现代音乐不为很多人接受,就是因为现代音乐不符合人的听力和大脑的感应机制。在这个研究中,实际上是在揭示这个听力和大脑的感应机制。假定这个机制是正确的话,现代音乐要为大部分人接受,它必须符合这个听力和大脑的感应机制。
作者: 甲米    时间: 2013-5-31 10:58
回复 Jwang 的帖子
尽管我不是神经科学的专业人士,但我也想人脑的体系是异常复杂的,她的感应机制应该是多层次的,上面论文中所建立的感应模型我认为仅仅代表了一种而已,更深层次的感应或许可以解释为什么现代音乐也是有可能被接受的。
这些研究有其科学意义,但是跟创作音乐与欣赏音乐无关。对于我们来说,还不如花时间尽情享受音乐本身吧。人生苦短,让科学家们去研究吧。
作者: alma    时间: 2013-6-3 01:18
谢谢各位大佬的参与。嗯,我说的是,如果声音有客观性,那么这个客观性是应该是可以测量的。如果我们不同意这个测量,那么是说明我们没有找到相对客观的测量工具。

主文中的测量是简单的,软件的,或者也是可笑的。但是,如果大家不同意这个基本问题,那么我们还能谈什么声音的客观性呢?
作者: alma    时间: 2013-6-3 01:23
如果古典乐真的走进这类声学实验的象牙塔尖的话,那古典乐的受众就更小众了又小众了,甚至于我也将排斥古典 ...
metamophore 发表于 2013-5-30 20:47


1060兄别这么捉急拒绝,音乐分析软件肯定会层出不穷的,虽然它们无法教你作曲,但是肯定让你目瞪口呆的。



作者: metamophore    时间: 2013-6-3 11:30
我很敬佩建筑学家,尤其是做音乐厅、歌剧院的建筑学家,能有音乐学知识和素养的建筑学家少之又少,也就造成了国内大量的音乐厅建筑都是由国外设计师设计的现状。
这些声学实验如果往建筑学应用这方面转化,我是充满希冀的。除此而外,只能是存在于象牙塔尖的室内尤物,甚至于观赏价值都不存在。
学术和非学术,有时候就是这么泾渭分明。这条线划出了菜鸟和非菜鸟的区别。我始终是抱定了菜鸟下去的决心,音乐只能是拿来为我所用的一种价值取向。而价值取向绝非轻易更换的。
哈,李教授的博学贴,确实对我这种菜鸟无可奈何了。
作者: 甲米    时间: 2013-6-3 12:06
对古典音乐的研究,有数学的、物理学的和神经科学的,虽然是小众的,但也有不少的文章发表,当然是在国际刊物上。不过要看懂这些论文需要高深的科学基础。
然而,对我们这些“菜鸟”而言,喜欢“古典音乐”这枚鸡蛋的味道,为什么一定要把它的DNA序列测定出来呢?难道分析清楚了它物质基础,你的味觉体验就会更丰富了吗?
作者: 甲米    时间: 2013-6-3 22:30
本帖最后由 甲米 于 2013-6-3 22:44 编辑

  新华网北京4月24日电 3位美国音乐教授日前设计了一种对音乐进行分析和分类的新方法,这种方法能够深入利用包含在音乐之中的复杂数理关系。

日前出版的美国《科学》杂志上,由美国佛罗里达州立大学的克利夫顿·卡伦德、耶鲁大学的伊恩·奎因和普林斯顿大学的德米特里·蒂莫奇科组成的3人小组简要介绍了他们的“几何音乐理论”,称这种理论能够将音乐语言转化为几何语言。
他们将一组组音符分类成不同的“家族”,考察它们的数学结构,并以“点”的形式把音符再现于复杂的几何空间中。这一过程类似于中学代数课上某些相对简单的内容———根据X坐标和Y坐标确定一个点在二维平面的位置
音符如果先被转换成数字,然后被转换成几何语言,那么人们最终将看到各种各样的几何空间,每个空间里都有一种独特的几何体。比如,“三和弦”在历经所有的数学运算后就会变成一个三角环。
不同的“家族”分类法会产生不同的几何空间,反映出千百年来音乐家对音乐的各种理解。科学家希望这项成就能够帮助人们更深入、更有效地分析和理解音乐。
作者: 甲米    时间: 2013-6-3 22:34
本帖最后由 甲米 于 2013-6-3 22:42 编辑

音乐旋律背后的几何学关系
作曲家常说恰当的和弦和音律结合在一起,就象声音是具有几何形状的自然物体一样——现在普林斯顿大学的音乐家向大家展示了高级几何学确实可以作为理解音乐结构的工具。
Tymoczko教授已经探索到深层次的元素布局和非欧几里得几何学在音乐领域的运用,并且总结出一种新的相对简单的音乐创作方法。他表示,“我现在正在试图告诉人们什么风格的音乐听起来更优美,或者哪种类型的旋律作曲家更加喜爱。”他说:“我希望做的就是提供一种新的音乐创作空间,如果你喜爱一种独特的和弦或者是一组音符,那么我能够向你展现的就是怎样找到其它相似的和弦并把他们连接起来创作出动人的音律”。
传统的音乐理念要求和谐的搭配由两三个音阶差的音符组成的和弦,例如由第一、第三和第五大音阶组成的和谐主和弦可以使大多数听众感到亲近和易于欣赏。然而很多20世纪的作曲家却抛弃了这一必要条件。现代和弦经常是由一些键盘上紧密连接的“音符簇”构成,这种在传统理念中不和谐的和弦时常向听众的耳朵提出挑战。
“西方音乐理念已经发展出用于思考传统和弦的有力工具,但是对于思考新的和弦,这一工具却不够完善”,Tymoczko表示:“这一差距指引我们去发展一种更加普遍的几何模型,以空间的一点标明每一个可以想象到的和弦形式。这种方法,在您听到任何形式的和弦组合时,即使再不寻常,您仍然可以将它以空间中的点连续的标明出来。为了理解这些和弦的美妙旋律关系,您可以通过连接这些空间的点得到怎样改变音符来组合成下一个和弦的表达。”
在Tymoczko的音乐空间中有一个类似三角棱镜的表达,其中聚合在三角形中心部位的点描绘了和弦传统意义上的和谐搭配,并与邻近的一些其它有关和弦形成整洁灵巧的几何形状。而那些不和谐的簇型和弦协调形式可以在三角形边缘以外部位靠近它们自己谐和体系的空间找到。
Tymoczko说作曲家们已经口头评估了一种不需要听众从一个空间区域过快地跳到另一个区域的和谐连接形式。“这种方法你应该待在空间中的一部分,”他表示“这是我们统一音律概念中的一个重要因素”。
为了将这些思想付诸现实,Tymoczko创作了一个视频来解释19世纪作曲家肖邦弗雷德里克的一段曲子中的和弦运动情况,他的E小调钢琴序曲(作品 28, 第4号)从19世纪30年代以来就一直吸引着无数听众,但却没人能够很好的解释这些和弦的和谐性。
“这个序曲非常神秘”,Tymoczko表示:“虽然它基于传统和谐,但是却是由人们无法描述的并不标准的连续和弦连接而成。尽管如此,当您划分这些和弦运动的几何空间时,你可以清楚地看到肖邦是将它保持在一个主要的区域内,使用很短的线条向前移动。”
所有的这些都预示着你可以用自己的耳朵去欣赏任何形式协调的音律,无论是300年前的圣歌还是当代您能想象到的最顶级音乐簇。”他说:“但是每次欣赏之前您必须决定您要从哪里开始,同时您的和谐形式在空间中的哪一区域,普遍的音律统一准则建议您要待在这一区域附近。”
Tymoczko的作曲风格影响着包括古典、摇滚和爵士在内的各种风格的音乐,但是他表示并不期望人们因为他的研究从此开始通过“连点成线”的方式创作。他希望至少可以提供一种新的工具帮助人们更好的理解音乐背后的内在关系。
作者: 甲米    时间: 2013-6-4 08:22
Tymoczho, 作曲家和音乐理论家
[attach]71209[/attach]

全四音和弦的几何空间


作者: 甲米    时间: 2013-6-4 13:26
有兴趣的同学可以进一步看看他的书
[attach]71243[/attach]

作者: alma    时间: 2013-6-6 03:38
音乐旋律背后的几何学关系
作曲家常说恰当的和弦和音律结合在一起,就象声音是具有几何形状的自然物体一样 ...
甲米 发表于 2013-6-3 22:34


这个研究很赞。



作者: 牛仔    时间: 2013-6-6 23:27
立体声概念已说的很清楚了




欢迎光临 极品人生 (http://hk.hiendlife.com/x1/) Powered by Discuz! X3.2