loader from loading.io

sxsradio 2021 podcasting setup

Side by Side Radio

Release Date: 12/15/2021

前口上

2018年6月から開始したsxsradioは2021年ついに100回に到達した。初回はまともに話すことすらうまくできておらず音声編集の技術も未熟だったために黒歴史化しているが、さすがに100回やったらそれなりにできるようになってきた。その技術の一端をここに記述したい。

背景

最高峰の技術としてはラジオ局のものがある。これはプロ機材並びにスタジオを前提としており、Web上にもほとんど資料が見当たらない。例えばNHKがどのようなマイクでどのように音声を処理しているか?という単純な疑問もうまく回答がみつからない。民生品を利用して(比較的)安価にPodcastの収録/編集技術を紹介しているものとしてクラシックなものとしてはRebuildを運営する宮川氏のスナップショットがある[Miyagawa 2020][Miyagawa 2017]。他にRui Ueyama氏によるTuring Complete FMの裏側[Ueyama 2018]があり、両者のANDをとるとそれなりの音が取れる。機材メーカーの公式資料としてはTASCAMナレーション録音ガイド(PDF)がある。機材等についての動画はPodcastageJulien Klausのチャンネルが詳しい。要約するとa. 静かなところで b. 1万円以上のマイク等を利用し、c. マルチトラック録音。そして編集後にd. Auphonic Multitrackを使うと良い。

しかし、先人の文章に記述がなかったため苦労した点として

  • 新しい/数回しかでないために機材投資がそれほどできないゲストがいる
  • ローカル収録がどうやってもゲストによっては難しい
  • 野外収録/インタビューをどうやってやるか。野外で収録した音源をどのように処理するべきか
  • Auphonicの独特な癖に対応する

という点があったため、それぞれホストの西薗なりの回答を記述しておく。もし他に良い方法があればぜひ西薗のTwitter番組のTwitterにお寄せいただきたい。

機材を準備できないゲストがいる問題

iPhoneの純正イヤホンは多くのPodcasterが使いこなすべきアイテムである。日本ではiPhoneのシェアが高い(文献にもよるが2021年現在で50%は超えそう)。付属の白イヤホンマイク/Apple EarPodsは究極の量産効果とエンジニアリングが効いていると考えられ、実際にそれなりの音が取れる。しかしながら次の問題が知られている。マイクが胸元にぶら下がることからマイクに触れてしまうことによってタッチノイズがよく起きる。このため収録前にマイクに触れないようによく説明すること。

タッチノイズはAcon Digital Declick2でかなり消える。この他にもDeClip2, DeNoise2等はとても優秀で軽量なプラグインであるため、PodcasterにこれらがパックになったRestoration Suite 2をおすすめする。後述するCleanfeedを利用する場合、iPhoneの純正イヤホンをMac/PCに挿してChromeなどから利用してもらうか、iPhoneのSafariから使ってもらうことになる。

なお、[Miyagawa 2017]によれば安価なヘッドセットを使えるという記述がある。ヘッドフォンから漏れ出た相手方の音をマイクが拾いやすいことが注意点として挙げられているが、3000円程度の2機種ほどを試したところ、どうやってもこの音漏れが解決できなかった。同様の現象は[あらB 2021]にも記述されている。ボイスチャットソフトによってはこれをキャンセルするかもしれないが、ローカル録音やCleanfeedではこのような機能はないため、利用しないことを勧める。

AirPods Proなどを始めとしたBluetoothヘッドセットもおすすめしない。Bluetooth系のヘッドセットは対話時にレイテンシを少なくするために伝送レートに限界があるため高品質にしづらい。

近年のMacBook系はマイクがそこそこ優秀であると言われているので、モニタリングのみ音漏れの少ないイヤホン・ヘッドホンを利用してもらえれば使える可能性があるが未検証。

上記のような問題はさておき、そのタイミングにしか取れない貴重な話というのは存在する。そういうときには容赦なくFacebook Messenger / Facetimeなどを利用して収録する。電話音質にはなるが、いっていることはわかる。収録にはAudio HijackLivetrak L-8を用いる。大概は両方走らせてバックアップにしている。

ローカル収録がどうやってもゲストによっては難しい

多くの文章で当然のようにリモート収録の場合にはローカル収録、すなわちボイスチャットソフトを利用しながら手元で録音してインタビュー後にファイルを送信してもらうことを推奨している。しかしこれをスムーズにこなせるゲストは大変稀である、というか普通いないものと思ったほうが良い。その技術を進んで数回の収録のために習得しようというのはITに明るい奇特な人だけである。なので、弊PodcastではCleanfeed($22/month)の音源を採用している。Cleanfeedは通常のボイスチャットソフトと異なり、聞きやすくするための加工をせずに、生音源に近い状態で伝送してくれるため、後処理がやりやすくレイテンシが低い。また、自動的にマルチトラック音源を使える。なお、対抗馬としてはZencastrがあるが、今年前半の時点では安定性に難があったのでCleanfeedを採用した。Rebuildでは通話のためだけに使われているらしい。

野外収録/インタビューをどうやってやるか。野外で収録した音源をどのように処理するべきか

sxsradioではレース会場でのインタビューがエピソードの主軸になる場合がある。レース会場は大概何らかの背景音が流れており、それが臨場感をもたらすこともあるが、過度な場合には聞きにくさにつながる。

収録時にはiPhoneのボイスメモ / Zoom H5の付属マイクを利用している。iPhoneのボイスメモは会議の議事録などを収録することを前提に作ってあると思うが、背景音を適度に取り込みつつ会話がうまく入るようなそこそこハイ・フィデリティ感のある音で取れる。H5はより感度が高いので調節は難しいが、ハイ・フィデリティ度を増すことができる。どちらもインタビューをする相手に十分に近づけることがS/N比を上げるために肝要である。

処理のポイントはAuphonic Leveler / Multitrackの機能であるnoise reductionを少ない程度かけることをおすすめする。Auto以外にノイズリダクションレベルを3-100dbで選べるが、3-6程度かけると良くなることが多い。野外以外のノイズリダクションは喋らない状態も収録した上で、Acon DeNoise 2を最低限使う。概ねノイズリダクション系は少なめが良い

Auphonicの独特な癖に対応する

Auphonic Leveler / Multitrackは半自動で音を「いいかんじ」に仕上げてくれるPodcasterにとって魔法のような道具であるが、完璧ではない。使い方としては[Miyagawa 2020]に記述されてあるように事前にレベルを揃えるために使う/全ての編集が終わったあとにトラックを入力するという2通りがある。トラックごとに書き出し -> Multitrackなのか、全体をバウンスしてシングルトラックにして -> Levelerなのかが先行研究では明示されていなかったが、これは比較したところ各トラック -> Multitrackの方が良い音になりやすい。

Adaptive Levelerは場所に応じて音の大小を判断して音圧を調整してくれる便利な機能だが、入力する音の粒が揃っていないと無理やり音が小さい部分を引き上げることから、ノイズが目立って変な音になることがある。このため、編集前のLevelerではAdaptiveをOffにして、編集でそこそこ音の粒を揃えた上で最後にAdaptiveをOnにして入力するとよい。DeClick / Denoise等もやっておかないとAuphonicはうまく動かないことがあるので注意すること

ノイズリダクションAutoは強力すぎて使いにくい。ノイズリダクションの強さが変化するところが目立ちやすいため、先に述べたとおり野外収録の場合のみ6db(low)程度だけかけている。

Methods

価値関数

そこそこのHigh Fidelityで、移動中や作業中にも聞きやすい音質を目指す。録り音が完璧ではなく、基本安定しないのでリペア技術でなんとかする。

Hardware

  • Audio interface: Livetrak L-8 / Motu M2 (Nishizono)、SSL2 (Oyama)、Audient Evo4 (kossy, hako)、Komplete Audio 1 / Audient Evo 4 (Zaikou)
  • Mic: Shure Beta 87A / SM58 / PG58 / Zoom H5 Stereo (Nishizono)、Marantz MPM1000U (Takada)、Blue Yeti (Takagi)、Aspen Pittman Designs DT1 (Zaikou)、Classic Pro CM5S (kossy & hako)、Earthworks SR314 (Oyama)、Samson Q2U (Special guests)
  • Recorder: Zoom H5 / Livetrak L-8 (Nishizono)、Tascam DR-07X (Nakane)
  • Monitoring: Audio Technica ATH-R70x for mixing / Sony MDR-7506 / Audio Technica ATH-M40x / Zennheiser IE80 for monitoring / Apple earpods / Apple Airpods Pro / IK Multimedia iLoud Micro モニタリングはいろいろ試したほうがよい。ハイファイでしっとりした音は静かに聴いているぶんにはよいが、例えばカーステレオでは聴きにくい。sxsradioのリスナーのリスニングシチュエーションとして重要な場面に遠征の行き帰りやローラー中に聞く、というシチュエーションを想定している。
  • Headphone amp / DAC: ifi Zen DAC
  • Computer: MacBook Pro 2018

Software

  • DAW: Apple Logic Pro X
  • Leveler: Auphonic Leveler / Multitrack
  • Voicechat: Cleanfeed
  • Hosting: Libsyn
  • Recording & Broadcast: Audio Hijack
  • Plugins: Acon Digital Restoration Tools 2
  • MP3 encode: Forecast

Gain adjustment

音量メーターが使える場合、普通に話して-12~-9にメーターが振れるようにするべき[Podcastage 2018]。この設定は野外録音時にH5等を調整するときにも使える。Cleanfeedはさらにデジタルのミキサーがついているので、色が緑と黄色の境目ぐらいになるよう調整する[Cleanfeed: Your first interview]

Discussion

1万円以上のXLRマイクやUSBマイクを使って静かなところで撮った音源であれば、それ以上のことは普通リスナーは気づかない。レギュラーの高田氏が言うように「音質より質」である。よって現在以上の機材アップグレードはあまり意味がないであろう。しかしながら音声収録は良い趣味だし、大局的にはリスナーにも役立つのではないだろうか。

一方でAuphonicや一部のプラグインの使い方を十分に知っておくことで編集時間を減らすことが、これは番組の本数を増やすためにも本質的な投資である。DTM数分の曲作りと異なり、処理すべき音源は2時間も3時間もある。省力化しながら90点をとれるワークフローを音源に合わせてフレキシブルに考えられるのが技術であるといえる。常にリモートかつ静かな環境でダブルエンダー録音ができるのであれば、一度決まった設定を使い回せる。

Acknowledgement

各種機材投資を行い、試行錯誤ができたのはPatreonサポーターやフィードバックをくれるリスナー、聴いてくれるリスナーのおかげです。上記のようなツールなしでも制作そのものは不可能ではないのですが、かかる時間等を捻出するためには不可欠です。