头戴式耳机吧 关注:8,240贴子:19,693
  • 9回复贴,共1

什么是耳机的声场(音场)?

只看楼主收藏回复

声场这个概念可能是平常讨论耳机或者播放器音质时比较常用到的一个词汇,也是比较难阐述的一个HiFi名词,其所涉及的声学知识较多,故在此不进行深度论述,目的旨在帮助读者建立关于耳机以及其他音频器材的声场(音场)概念,帮助大家在选购耳机时对产品品质进行辨识。
PS:本文讨论仅仅涉及HiFi器材讨论,如果你在使用动铁耳塞,请忽略本文。
写在前面的话:
耳机声场的还原从一开始就是一种模拟,音箱可以通过物理重构一部分的真实声场,耳机自始至终都是模拟的,所以耳机声场和调音关系很大。所以很多情况下,我们只将耳机的场感叫做音场。
关键词:响度和延迟
理论上来讲,人耳之所以能感受到声场是因为左右耳的响度差和时间差。
响度:很直观的可以感受到,声音越大,则距离人耳越近,左右耳响度差使得人耳能辨别音源方位;
延迟:包括声音的反射以及在空气中的残响感(堂音和残响表现能力)
可以看做是一个能量衰弱的过程


1楼2015-01-23 17:17回复
    声学讨论到此为止,下面我们从实际听感角度来看待声场的问题:
    各类器材声场真实程度的理论极限:
    耳机(人头录音)>=耳塞(人头录音)>音箱>耳机(普通音源)>耳塞。
    首先,我们必须明确一个顺序,声场体验的真实程度大致是按照上述顺序排列的,关于“人头录音”的概念,不明白的可以去问百度,这里不做过多理论解释;而音箱这里只讨论2.0声道的,因为环绕声不属于HiFi范畴内的东西,排序的依据是还原声场的完整度,人头录音是360度的,音箱和耳机普通音源都是180度的声场。
    音箱的声场会涉及很多环境布置的问题,所以本文讨论的情况仅仅针对耳机和耳塞(普通录音音源),并且声场形状是建立在听感经验基础上的,比较形象,但和声学理论并不完全相符,所以只能算是一个相对概念,请烧豆们各位自己斟酌。(以HiFi系统为准,监听后端系统请自觉回避)


    2楼2015-01-23 17:18
    回复
      第一,耳机声场的概念
      本文将耳机的声场(音场)基本概念分为两个可视化的区块部分来讨论,
      1)场感:包括声场范围,宽度和纵深等等。
      2)结像定位:声音的形、立体程度、距离感等体验
      之所以这么分类,是因为人耳对不同频率的声音敏感程度不同(不是所有频率的声音都能分辨距离和方位的),具体敏感度关系可以百度搜索“等响度曲线”。大概7000hz左右最为敏感,而极高频(12000以上)和极低频(150hz下)的声音都是不具有指向性或极弱指向性,比如雷声(低频),和一些电流噪声(高频),距离远点的话你很难分辨音源方位。相对而言低频指向性更差,而低频延迟对场感体验是十分关键的素质。
      如下图:声海(森海塞尔)动圈入耳IE8的两项分布
      IE8/hd650的声场 假设动态无失真情况
      A区域我们可以认为是结像定位区域,这个区域内听到的声音是凝聚成像的,是立体的、有方位感的,人声口型是可以分辨口型大小乐器之间的距离的。
      B区域我们可以理解为场感区域,也可以叫做能量场,是能量发散和消退的过程区域,决定了人耳声场听感的范围、宽度和纵深,影响本区域听感的因素主要是高解析度下的极低频和高频延展的表现。
      然后我们来看一下什么是声音的结像感,以及它和声场的关系。
      我们仍然用图片来举例,
      焦距和景深,可以看做声场的A和B区域
      结像感我们可以理解为摄影技术里的“焦距”概念,而有焦距就有景深,相当于声场的结像定位和场感的关系,结像定位线条要清晰,而背景线条要模糊,如果反客为主,则听感必然糟糕(监听耳机由于专业需要,会这么处理细节)
      另外,声场的A和B区域必须是一个完美融合的过程,两者过度不应该存在明显界限,这个问题关系到一个结像面大小的问题。比如鼓声,除了有一个富有质感和方位感的鼓点外,鼓面大小要通过B区域的低频延迟来判断。也就是说B区域的听感会对A区域结像感的真实程度有很大影响。
      PS:关于结像感,烧组拙作一篇,可供参考:点击查看
      上述情况都是理想状态,下面我们来看看各种耳机、耳塞大致的声场形状(假设动态无失真的情况下)
      为了避免误导,下面会举例说明不同耳机的音场形状


      3楼2015-01-23 17:19
      回复
        1. 耗材级的耳机、耳塞
        声场被压缩,几乎没有结像
        我们常见的mx360,以及各类装机用耳塞,特点是所有声音全部在脑袋内发出,音场扩散拥挤在中间,当然你用sony的旗舰播放器X1000系列搭配森海系耳塞时候,也会产生这种音场拥挤的感觉。
        2.消费级耳机、耳塞(700下,不排除有特例)
        有场感,但是缺少结像
        比如mx760,dtx80,dtx300p,px100等,有很大一圈音场~,你可以感觉到声音明显向外部扩散,但是没有什么定位和结像能力,声音密度差,动态小,所有声音都在中间一点发出。
        3.hifi入门级耳机、耳塞
        场感、结像二选一
        er4p和TF10,以及ie7。动铁多数是音场广阔定位不错而缺少结像,ie7这类人声系的动圈耳机则是结像感不错,但是音场不够通透。而FS的新单元的M5还有FX700则是属于比较中庸类的。
        4.hifi级耳机、耳塞
        IE8/hd650的声场 假设动态无失真情况
        IE8和exk这类动圈旗舰可以做到这种效果。而动铁的声场是个大问题,多数是音场广阔而缺少结像的空间感。
        5、hi-end级的耳机(目前还没有耳塞能达到,如果唯一有一个的话,便是IE800,使用了最新的微动圈的技术,动态控制能力完全不差于大耳机,会有低频微动态的表现)
        HD800,ed9这类拥有低频微动态表现能力的耳机才拥有在弱指向区域的结像能力
        这个程度目前听过的只有ed9和hd800吧,kk也算一个,但是我没听过完全推好的。微动态,就是低频动态还原能力,可以让你的音场扩大一圈,并且在微动态的音场区域内你可以分辨声音的距离和方位。比如远处的爆炸声。所以有微动态的耳机,看电影玩游戏会非常爽,而在玩游戏时候的代入感和声场真实度,完全超越各类音箱,因为hifi音箱无法表现背后音源,而环绕声音箱有一定的距离延迟,代入感欠缺点。有米的朋友可以试试ED9接随身解码玩游戏,绝对是顶级享受。
        比起之前的耳机,此级别的耳机声场能够对低指向频段的声音进行距离和方位上的结像


        4楼2015-01-23 17:20
        回复
          结像感,这是一个极其重要的声场属性,甚至可以说,无结像不声场。
          (对于那些坚持认为耳机无法听到前方声音的童鞋,可以对比一下HD600和DT800,就知道纵深概念了,再次重申!监听系统的同学请回避此篇文章,否则会产生大量仇恨)
          写在前面的话:
          1)结像感对于HiFi器材是十分重要的属性,但此属性对监听系统则是非必选的,后者会根据专业需要进行针对性的调整,所以本文仅以HiFi系统的声场体验来描述。
          监听系统的目的是还原音源发出的声音,HiFi系统的目的是还原人耳听到的声音,这是两者理念的本质区别,监听系统普遍少残响表现能力(缺少厅堂感,声音取向以录音室为准而非音乐厅和剧院)。
          2)HiFi耳机系统的声音结像应该是在脑袋前方的,否则会有严重的头中效应,具体看器材搭配和耳机调音实力。总之,产生较强的头中效应的调音是很失败的(普通音源下,耳机不能避免头中效应,但是可以通过调音来减少头中的感觉)。
          3)本文是HiFi概念普及型文章,不涉及专业讨论,图文为直观听感的图示,距离为相对值,仅供参考。
          4)出现明显结像感的耳机基本上是大于¥2000的,系统价位在5k~10k之间,耳塞要求至少是系列的旗舰塞子,前端播放器推力要够大。
          5)所有耳机系统的结像感都存在或多或少的失真,因为耳机的声场是一个虚拟场(是通过曲线调音来完成声音相位还原的),例外的可能仅有AKG的声场神器KK(声场纵深可以按米算……)。
          失真表现在声场大小、形状;结像面大小、形状、定位、纵深距离上。简言之,“还原一个真实声场的难度,无异于还原一个世界”。
          6)关于纵向声场
          我们经常听到的一个词,横向声场和纵向声场。纵向声场就是声场内发声源距离听者的距离。纵深的前提是器材系统必须有结像能力,没有结像能力的系统不存在声场纵深概念。
          一般以最远乐器或者声部的结像定位距离作为声场纵深的距离,比如交响乐编制中的打击乐声部(所以优秀的声场纵深必须有低频微动态的表现能力,因此耳塞在结像纵深多数都不理想,包括各类定制)。
          7)关于流行乐的声场,由于流行乐都是经过专业混音处理的,所以基本上其声场内只存在两种声音形象,人声和配乐,器材能将两种声音形象的空间感还原出来即可,对结像方位要求较低。
          结像感的描述:
          1、什么是结像感?人耳怎么样识别这种听感?
          首先,结像感是一种听感,类似摄影中的对焦,因为人有两只耳朵,所以同视觉一样,听力也有一个对焦的概念,而对焦的结果我们称之为结像。
          声学上,人耳主要是通过声音的响度、混响和延迟时间来判定距离,通过左右响度差来判定方位;两者结合后,就是一个立体声形象,理论知识谈到到此,下文还来看大家熟悉的听感。
          PS:关系到声场真实度的另外一个重要指标是HRTF(头部反馈函数),这个和音源处理的问题关系较大;常玩游戏的朋友可能知道,游戏3D音效选择里面有D3D full HRTF选项,这个是针对耳塞的,none HRTF是针对音箱的,而less HRTF是针对耳机的,本文讨论不涉及这部分内容,因为市面多数音乐是普通立体声音源,没有HRTF信息。
          2、结像感的类型
          结像基本类型分为三种:
          小编制:独奏结像(人声结像)
          中编制:独奏结像+群奏结像(协奏曲、歌剧)
          大编制:群奏结像(声部结像、环境结像、能量场结像)
          按照还原难度来说,是两个极端。这个问题就会涉及到老烧们经常提到的一个HiFi的悖论,既是一套HiFi系统很难同时满足大小编制的回放要求(相对那个价位的水平而言),大奥和箱子也不行,必须有所取舍。而现场的听感基本上可以说是完美融合的混响,这点确实是Hi-end系统永恒的目标,该清晰的时候分毫不差,要气势的时候,磅礴如涛。


          5楼2015-01-23 17:21
          回复
            关于独奏结像(人声结像)
            形象一点的说,就是歌者在唱歌的时候,你能判断其口型大小和距离位置。这时候结像越清晰越好,线条感柔和不刺激为理想,就是声音要足够细腻。
            如下图(图示为理想状态,用IE8的听感作为一个中值,主要是因为这是本人的配塞,比较熟悉,不过IE8比较偏中大编制,是小提琴协奏曲以上编制的声音结像)
            理想中的结像感(人声)
            这是IE8理想情况下的结像感图示,比较规整的结像定位感,前端是Sony D1 lo接随身耳放D6(AD8620BR运放)的IE8。
            关于群奏结像(环境结像、能量场结像)
            声部级的结像是这种情况,我们可以称之为群奏结像,也可以叫做环境结像(电影原声的效果),要求是结像清晰且必须能量有发散感,边界不能有明显的线条感,要模糊(混响感,比如厅堂感),否则听感非常刺激,是很糟糕的听感,容易导致听觉疲劳,不利健康。


            6楼2015-01-23 17:21
            回复
              3、影响结像感的因素?
              通过两张图的对比,我们得到一个结论,即声音距离人耳越远,其能量凝聚感越差,或者说发散感越强,那么结像面就会扩大。这点大家应该有体验,把音量调大,声音凝聚,调小发散,响度大小是人耳判断距离的重要依据,这个下文会详谈。
              前端问题:
              1)耳机驱动能力
              理论上来说,在前端系统中,表现大编制的声场需要高速的前级运放,压摆率和电流质量要求高,不然瞬态和动态都会欠缺,就是丢信息(对后端的影响就是缺乏能量感);交响乐大动态时候声音会非常单薄或者根本出不来大动态;但高速运放会对系统内部电路产生极大干扰,其在演绎小编制的时候,缺乏细腻感。
              前端系统中,几个常见的素质和指标对结像感的影响。
              推力=>影响动态范围、瞬态表现=>结像感
              压摆率(运放速度)=>影响动态表现能力、瞬态、信息量(能量感)=>结像感
              声道分离度=>声底干净程度、声音指向性、微动态表现能力=>结像感
              推力不足:
              动态被压缩的结像感
              推力不足的情况比较普遍,就是由于仅能保证中频和高频的能量供给,增大播放器音量后,低频速度和动态都跟不上,所以声场会严重缺少纵深,结像也被压缩,是一个平面化的效果,并且由于动态被压缩,声音基本没有立体感可言。比如IPC+IE8的组合,就是这种情况,所以IPC推IE8肯定是不及格的,比PC集成声卡输出还要差劲不少的声音,动态被严重压缩,声音没有感情色彩可言。
              PS:这里涉及到一个健康听音的问题,建议各位在追求音质时候尽量选择推力较大的前端播放器。在随身设备里,苹果iPod系列播放器建议选用针对其调音的耳塞/耳机,否则会间接对听力造成损害。当你用小推力播放器驱动一款高端耳塞的时候,为了让声音听起来更爽(更有对比,动态更大),会不经意的调高音量,而是用推力较大的前端,可以在音量(电平输出)较小的情况下达到悦耳的动态表现。(很多次聚会,我听不少烧友ipc的音量开的都很吓人,后来想了想,和ipc的推力有问题,在动态拉不开的情况下,增加音量会成为一个不经意的动作)
              过度驱动(推力过大)
              驱动过度的结像表现
              我们可以看到,在过度驱动的情况下,声音结像位置会明显被拉近(因为中高频的能量会过度),声场宽度仍然存在,但其实整个声场形状已经变形了;结像定位的情况,人声的头中效应会非常明显,大编制的结像也会扁平化,缺少立体和空间感(存在动态失真),比如C4+IE8的组合,就是这种情况,勉强算及格,有音场,也不小,虽然变形了。
              PS:过度驱动同样会带来一些间接的健康影响因素,基本上是还未将三频能量均衡化前,输出的音量已经超过人耳舒适听音的范围了。
              2)电平大小问题(音量大小)
              一个普遍的听感,当你调高音量的时候,声音会凝聚在一起,如果过大,则声音会乱掉,如果音量不足,则声音会散掉,常用mp3播放器的人应该都能感受到。
              音量大小对结像感的表达是有影响的,一套器材存在唯一一个区域,在这个区域内的电平是动态不失真的区域,超过或者达不到这个区域都会产生较大的动态失真,从而直接影响耳机的结像感表达。如果耳机价位在2k以上音量开到最大仍然没有人声结像感的话,那么前端播放器的推力不足,或者是驱动过度。
              电平和结像
              另外这和录音电平也有关系。因为人耳接受到的音乐响度信号是经过各种衰弱后的频响信号,这个响度是一个绝对值;而单元振膜通过电流驱动将器材的电压信号转换成声波,电流质量和电压信号的准确程度将直接影响到人耳最终听到的声音,那么录音时候的电平设置就是一个很重要的因素,通常古典录音电平都比较低,所以还原的时候要把电平调高,这个时候,控制力不足的前端很可能高频就飞掉了,因为抬升电平后,低频大动态是非常吃电流的,如果电流储备跟不上,那么低频的动态上限就会被削掉,高频就直接坐火箭上去了…
              (交响乐爆棚的高潮部分的时候,如果你听到都是华丽的弦乐组,或者弦乐和管乐交相辉映,看起来甚是辉煌,那么恭喜你,这套系统肯定听不了大编制;现场交响大动态的时刻,管乐声部会全面盖过弦乐部,以拉开动态范围烘托场面和气势,这时候是管弦乐齐鸣的时刻,如果弦乐组过分突出了,那么指挥的控制力就值得怀疑了)。
              这个问题同样是调音师应该把握的了,一个好的前端,素质和调音各占50%,考虑到人耳健康问题,最佳输出电平会设定在人耳比较舒适的响度范围内,但还要考虑后端耳机的阻抗和灵敏度性质,这些都会影响最终的声音响度。所以一个前端只可能适应有限的耳机,至于很多有增益的设备,只要是一条线路的,通过增益减益来达到不同阻抗灵敏耳机,多少存在失真,还不小,只有默认的电平输出是最小失真。
              后端问题(耳机):
              后端耳机中,假设前端系统不丢信息的情况下,单元的素质以及三频能量分布直接关系到系统的结像能力。(因为人耳对不同频率音频响度敏感程度存在明显差异,中高频最敏感,高频次之,极低频最差,所以极高频和极低频的响度差对人耳不具有明显指向性影响,但是这两个频段的延迟感会对人耳的距离判断产生影响,不明白的童鞋请去百度“等响度曲线”)
              可以说耳机的调音直接关系到结像感的存在与否,因为乐器发出声音都是经过空气传播衰减后才进入人耳的,所以耳机的频响曲线都是针对性(可能针对前端,也可能针对某一类音乐)的调音。
              冷声耳机和暖声耳机结像对比:
              冷声和暖声
              冷声结像的代表耳机/耳塞有:
              DT800,K501,ATH-ES7,ER4P/B,EXK(音色中性、结像冷瘦),ME-10EX(牙塞),omx980(初版非常冷,新版偏中性);
              中性结像的代表耳机/耳塞有:
              HD800,HD580J,MX980;
              暖声结像的代表耳机/耳塞有:
              RS1,HD650,M1,IE8;
              整体来看冷声阵营较多,一方面是这几年ACG势力比较庞大,另外是最近趋势偏向清淡,虽然音色冷暖和染色无必然联系,但高频清丽的声音会显得声底较为纯净;不过话说回来,冷声系的耳机适合还原小编制,在大编制方面冷声系缺乏现场的气氛渲染能力。
              虽然耳机音色的冷暖和结像感并无直接关系,但两者都受到三频能量分布的影响(调音),所以冷声和暖声特点在中频频段的音色对结像感影响并不小。而且并不是冷声声像就远而暖声就近,根据经验来说,声音结像的大小和声音的冷和暖有一些关系,纵深距离要视耳机而定,当然声像较大的耳机,纵深距离自然会近一些,并且有较好的包围感。
              4、结像感和声音的素质以及风格问题。
              结像感和定位、声场纵深、以及空间感的区别。
              结像和定位的区别在于,结像感并非一个点或者一个指向,而是一个有距离,有空间容量的立体声音形象。也就是说我们平时所说的结像感可以看做是结像定位感的简称。
              声场纵深是一个距离的问题,和结像清晰度关系不大,但是好的结像感,声场纵深必须够好。这里可以举一个结像优秀而缺乏纵深的例子,对~就是经典的DT800,典型的椭圆形的声场,在驱动不好的情况下,人声和乐器的声音就在脑袋里发出,有严重的头中效应,驱动良好的情况下,声像也较近,典型的监听风格。
              风格问题:下图是HM801搭配IE8的人声结像情况
              HM801+ie8的结像
              HM801应该是一款调音非常有特点的播放器,中频的细节动态被略微放大,换来了较好的人声听感,以及音乐的包围感。所以在801搭配IE8的情况下,结像被拉近,并且结像面会增大,会有不错的包围感,但是在大编制回放中,乐器位置会出现偏差。
              如果是Sony的X1000系列播放器的话,XK的高频信息有所丢失,所以其结像严重缺乏空间感,也就是结像位置都在中间,但是缺少残响信息可以换来纯净的声底和较为通透的场感表现。
              所以这里又有一个新问题,结像定位感,通常意义上的结像感,其实是结像定位感的简称,一个正确的像首先要摆在一个比较正确的位置上,否则不存在立体形象的问题。
              可以说结像定位感是一个器材组合是否合适的重要判断标准之一,当你聆听自己喜欢的音乐,其声音形象,和位置层次没有明显突兀或是漂移混乱的现象,说明这套组合是比较合适的器材组合。如果层次感混乱(比如大编制低音提琴过于凝聚,或者弦乐组过于突出),那么这套组合则表现不甚理想。
              这只是举两个例子,前端调音风格对结像感的影响,对器材搭配有兴趣的同学可以参考下。
              还有一些修改的地方,回头再说,先到此位置,码了2个月的文章,有什么意见的跟帖说,我会修改。
              在小组写过的一篇关于结像感的感性听感
              http://www.douban.com/group/topic/10557287/
              相关阅读:什么是耳机的声场(音场)?这不是“玄学”!(一)
              系列专题内容:
              1、音乐的动态
              2、耳机的解析力
              3、耳机的声场


              7楼2015-01-23 17:22
              回复


                8楼2015-01-23 17:23
                回复
                  顶一个


                  IP属地:福建来自Android客户端9楼2015-01-23 22:51
                  回复
                    牛贴


                    IP属地:日本来自Android客户端10楼2022-05-17 10:38
                    回复