2003 年度 卒業論文 デジタル音楽への可視型電子透かし...

30
2003 年度 卒業論文 デジタル音楽への可視型電子透かし システムの実装と評価 研究指導 中西祥八朗 教授 菊池浩明 助教授 内田理 講師 東海大学 工学部 電気工学科 0aep3128 本間太樹

Transcript of 2003 年度 卒業論文 デジタル音楽への可視型電子透かし...

Page 1: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

2003 年度 卒業論文

デジタル音楽への可視型電子透かし システムの実装と評価

研究指導 中西祥八朗 教授

菊池浩明 助教授 内田理 講師

東海大学 工学部 電気工学科

0aep3128 本間太樹

Page 2: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

1

目次

1.序論 3 1.1 研究背景・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・3

1.2 音楽データの著作権に関する不正コピー問題・・・・・・・・・・・・・・・3

1.3 JASRAC による違法音楽配信サイト対策(J-MUSE)・・・・・・・・・・・・・4

2. 音楽データフォーマット 5

2.1 はじめに・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・5

2.2 WAV(WAVE)・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・5

2.3 MP3・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・6

3. 電子透かし 7

3.1 概要・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・7

3.2 音楽データに対する電子透かし・・・・・・・・・・・・・・・・・・・・7

4. 可視型電子透かしシステム 10

4.1 通常の電子透かしと可視型電子透かしとの違い・・・・・・・・・・・・・10

4.2 可視型電子透かし・・・・・・・・・・・・・・・・・・・・・・・・・・10

4.2.1 透かし情報埋め込み・・・・・・・・・・・・・・・・・・・・・・・10

4.2.2 透かし情報抽出・・・・・・・・・・・・・・・・・・・・・・・・・11

4.3 システム概要・・・・・・・・・・・・・・・・・・・・・・・・・・・・12

4.4 システム実装・・・・・・・・・・・・・・・・・・・・・・・・・・・・13

4.5 システム仕様・・・・・・・・・・・・・・・・・・・・・・・・・・・・15

5. 実験内容及び実験結果 17

5.1 目的・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・17

5.2 実験項目・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・17

5.3 理論・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・17

5.4 実験方法・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・18

5.4.1 可視型電子透かし認識視聴実験・・・・・・・・・・・・・・・・・・18

5.4.2 透かし情報耐性実験・・・・・・・・・・・・・・・・・・・・・・・19

5.4.3 実験環境・・・・・・・・・・・・・・・・・・・・・・・・・・・・19

5.5 実験結果・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・21

6. 考察 26

Page 3: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

2

7. 参考文献 28

謝辞

Page 4: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

3

第1章 序論

1.1 研究背景

近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

なった。だが便利になった反面、P2P ファイル交換ソフトを悪用することによって著作権

のある音楽データ等がネット上で不正に交換されているなど、深刻な社会問題となってい

る。そこで本研究では、著作権のあるデジタル音楽データに対し、著作者を示す画像を埋

め込む事によって、不正利用の抑止を試みる。岩切了によって[1]で提案されている可視型

電子透かしシステムを Java 言語を用いて実装し、その評価を報告する。

1.2 音楽データの著作権に関する不正コピー問題

現在、音楽データの不正コピーの主な原因となっているのが P2P ファイル交換ソフトで

の不正な交換によるものである。P2P ファイル交換ソフトとはインターネット上で、不特

定多数のコンピュータ間でファイルを共有出来るソフトである。P2P ファイル交換の元祖

と言われるのが1999年に登場したNapster社が始めたP2Pファイル交換サービスNapsterである。このサービスによって日本国内だけでもダウンロードされた音楽ファイルの総額

は正規にダウンロードした金額に換算すると 143 億円に上るとも言われる。図 1.2.1 は近年

の日本における音楽レコードの売上状況を示したグラフである。図からもわかるように

1999 年以降、音楽レコードの売上は下降の一途を辿り、音楽業界に多大な損害を及ぼして

いる。現在普及している多くの P2P ファイル交換ソフトは無料で手に入れる事が出来、誰

でも簡単に利用する事が可能で ある。P2P ファイル交換ソフト を利用する事は違法な事ではな いが、著作権のある音楽データ 等を交換する事は違法である。 P2P ファイル交換ソフト用者は 現在 100 万人程だと言われてい る。

図 1.2.1 日本における音楽レコードの売上状況

(百万米ドル)

Page 5: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

4

1.3 JASRAC による違法音楽配信サイト対策(J-MUSE)

ここでは JASRAC(日本音楽著作権協会 以下 JASRAC)が行っている違法音楽配信サ

イト対策(J-MUSE)を紹介する。J-MUSEとは JASRAC MUSIC SEARCH EXPERT の略で JASRAC が行っている「JASRAC NETWORCHESTRA SYSTEM」の一部であり

ネットワーク上の違法音楽配信サイトを監視するシステムである。「JASRAC NETWORCHESTRA SYSTEM」は次の5つのシステムから成り立っている。 「J-TAKT - 許諾受付システム」

ネットワーク上で JASRAC が管理するCD音源データなどを使いたい場合、申し込

みの受付となるシステム

「J-CLEF - 許諾マーク発行システム」 J-TAKT で許諾を受けたサイトに対し許諾マーク(図 1.3.1)を発行す

るシステム。このマークは画像ファイルでこの中には JASRAC の管

理番号や URL などの情報が電子透かしとして埋め込まれている

「J-NOTES - 曲目報告・報告システム」 利用者からの曲目報告を受け付けるシステム

「J-WID - 作品データベース検索システム」 JASRAC が管理する作品の権利関係を検索できるシステム

「J-MUSE - 監視システム」 JASRAC が管理する作品を使っていて許諾マークがないサイトや許諾マークを不正に

コピーしたサイト等を対象に検索をし、違法サイトとしてデータベース化し、警告メー

ルなどを発信するシステム。 ※JASRAC NETWORCHESTRA SYSTEM はこの5つのシステムが連携して動いている J-MUSEは 2000 年 10 月 23 日から稼動している。これはサイトに許諾マークがない

又は許諾マークを不正にコピーして載せているなどの違法なサイトを対象に検索している。

そして稼動を始めて、約 2 年間の間で違法アップロードサイト約 6000 件を収集したが半数

近くのサイトオーナーの連絡先がつかめず警告メールを送ることができなかった。だが

2002 年 5 月 27 日に施行されたプロバイダー責任法によりサイトオーナーが不明な場合で

もISPに直接通知して公開停止措置の要求が出来るようになった。そして 2002 年 10 月

15 日からこの作業を開始し、2003 年 10 月 17 日の時点で 595 件のサイトを対象に約 34000ファイルを公開停止させたのである。

図 1.3.1 許諾マーク

Page 6: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

5

第2章 音楽フォーマット

2.1 はじめに

現在、インターネット上で扱われているデジタル音声データを音楽データと定義する。

この音楽データには、多くのフォーマットが存在するが大別すると圧縮されているフォー

マットと非圧縮のフォーマット(PCM)に分ける事が出来る。ここでは、それぞれの代表的

なフォーマットについて説明する。

2.2 WAV(WAVE) WAV とは、Windows で標準的に使用される非圧縮フォーマット(PCM)であり、データ構

造は RIFF 形式で記述されている。RIFF 形式とは Microsoft 社によって策定された画像や

音声などの様々な形式のデータを一つのファイルに格納するための共通のフォーマットで

ある。WAVE ファイルのヘッダ部はチャンクと呼ばれるデータの説明とデータのまとまり

から成り立っており、図 2.2.1 に示すようにファイルサイズやファイルの種類の情報を格納

した RIFF チャンクから始まり、チャンネルやサンプリング情報を格納した fmt チャンク、

サンプル数を格納した fact チャンク、波形データを格納した data チャンクの 4 つのチャン

クから基本的に出来ている。波形データは 8bit か 16bit データで構成され、8bit なら-127~128、16bit なら-32767~32768 の間の値で記述される。非圧縮であるためサンプリング

周波数が 44.1kHz、量子化ビット数が 16 ビットで音声の長さが 30 秒のデータであると数

Mbyte と容量が大きくなってしまい、あまり PC の保存用データには向いていない。

図 2.2.1 WAVE ファイルのヘッダ部分

Page 7: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

6

2.3 MP3 MP3 とは MPEG-1 Audio Layer3 の略で、動画の圧縮方式「MPEG-1」のうち、音声デ

ータの圧縮技術を利用して作成される音声ファイルである。データの圧縮率が高く、音楽

用 CD 等に利用されている PCM 方式に比べて、約 1/10 程度のデータサイズに圧縮するこ

とが可能である。圧縮率は 32kbps~320kbps の間で選択でき、人間の聴覚上の判断では

128kbps 程であればCDの音源と区別がつきにくいと言われている。 MP3 のデータ圧縮では人間の聴覚の欠点である部分を巧みに利用し、人間が聞き取るこ

とのできない音の成分を削除し、データサイズを小さくするという処理が行われている。

この時、最小可聴限界とマスキング効果と呼ばれる心理聴覚評価が判断基準として用いら

れる。 (1) 最小可聴限界

最小可聴限界とは、静寂時に人が聞き取ることが出来る最小の限界の事である。人間の

耳は 20Hz~20000Hz の間の周波数ならば聞き取る事が出来ると言われている。その中で

も、よく聞き取ることが出来るのが 2000Hz~5000Hz の間の周波数帯域で、この周波数帯

域を基準に周波数が小さくなったり大きくなったりしていくにつれて人間の耳では聞き取

りにくくなっていく。この特性を利用して、人間の耳では聞き取ることが出来ない範囲の

データを削除することによって圧縮率を高めている。 (2)マスキング効果 マスキング効果には周波数マスキング効果と時系列マスキング効果の 2 種類がある。周

波数マスキング効果は、例えば静寂時ならば小さな音でも聞き取ることが出来るが同時に

大きな物音がするとその小さな音を聞くことは難しい。これは大きな音と小さな音の周波

数が近ければ近いほどこの効果は大きくなる。周波数マスキング効果は同時に音がなった

場合の効果であるが、時間的にも効果が現れるのが時系列マスキング効果である。それは

大きな物音が鳴った場合にその前後 1/1000 秒以内になった小さな音は聞き取りにくくなる

というものである。これもやはり周波数が近ければ近いほど効果は大きくなる。マスキン

グ効果の影響は 1kHz 以下では約 100Hz の範囲、1kHz 以上では周波数が大きいほど影響

を及ぼす範囲は大きくなると言われている。

Page 8: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

7

第 3 章 電子透かし

3.1 概要

現在、流通している紙幣を本物と判断するには紙幣に刷り込まれた透かし情報がそれを

判定する上で不可欠の情報となってくる。このような概念をマルチメディアに応用したも

のが電子透かし(digital watermarking)である。電子透かしは情報デジタル化時代の流通形

態に対応した著作権保護を目的とする技術であり、画像や音声などのデジタルコンテンツ

にその冗長性を利用して他の情報を埋め込み、不可視の状態で隠し持たせたものである。

電子透かしには以下のような特徴がある。 (1)著作物に著作権を示す透かし情報が残り続ける いったん埋め込んだ情報を無理に切り取ろうとすると、著作物の質が劣化し使い物にな

らなくなる。程度にもよるが、圧縮や加工などを施しても、埋め込んだ透かし情報が失わ

れることはない。また、パソコンから紙に印刷した画像や、CD からオーディオテープに録

音した音楽のように、フォーマット変換しても透かし情報を取り出せる。 (2)著作物のどこに透かし情報が埋め込まれているのが分かりにくいこと ほとんどの人は画像を見たり、音楽を聴いたときに、埋め込んだ透かし情報に気付かな

い。これは、人間の目や耳では知覚しがたいノイズという形でデジタルコンテンツに埋め

込まれているからである。また、デジタル著作物の一片からでも、またその印刷物からで

も電子透かし情報は抽出できるように、画像にまんべんなく透かし情報を入れる。透かし

情報を除去するには、著作物のどこに埋め込んであるのかをまず探さなければならないた

め、不正コピーを抑止する効果が期待できる。 (3)透かし情報を埋め込んでも著作物はオリジナルの状態をとどめられること 画像データや音楽データに存在する冗長性に着目し、透かし情報を雑音として埋め込む。

雑音なので、埋め込んだ後も全体のデータ量は変わらない。但し、電子透かし情報は(隠

すデータ)量は多ければ多いほどデジタル著作物の品質の劣化を招く。ここに電子透かし

技術の難しさがある。

Page 9: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

8

3.2 音楽データに対する電子透かし

音楽データへの電子透かしには周波数領域へ変化しないで埋め込む方式と周波数領域へ

変化してから埋め込む方式がある。 (1)周波数領域へ変化しないで埋め込む方式 (a)ビット置換型 音楽データのビット値を置換する方式。聴覚は比較的振幅の変化に対して鈍感であるの

で部分的に振幅をわずかばかり変更しても耳にはわからないがなるべく極力耳に聞こえや

すい部分に電子透かしを埋め込むことは避けるべきである。この方式では電子透かしの除

去が簡単にできるのが欠点である。 (b)統計的埋め込み型 透かしの有無で統計的な偏りが生じることを利用して、1回当たりはわずかしか変化さ

せないが全域にわたって埋め込むことを特徴とする方式。代表的なものとして互いに2点

を選んで増減を行い、統計的に分布の偏りをつくるパッチワーク法が知られている。 (c)マスキング利用型 聴覚のマスキング効果を利用して聞こえない領域に別の音を電子透かし情報として利用

する方式。マスク閾値以下の音であれば耳には聞こえないので 透かし情報として利用でき

る。しかし、この方式ではマスキング情報は耳に聞こえなくても信号としては誰でも確認

する事が出来るので透かし情報の除去も容易になってしまう。マスキングはいくつかの要

因の影響を受けるので、巧みに使って電子透かしを埋め込むことが可能となる。 (d)エコー利用型 埋め込み情報によりエコーの長さを変えることにより透かし情報とする方式。これも聴

覚的なものを利用した方法で、マスキング利用型同様、信号成分としては明らかに電子透

かし情報を読み取ることが可能である。エコーも大きく掛けると聴覚的に分かるようにな

ってしまうのが問題である。

Page 10: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

9

(2)周波数領域へ変化してから埋め込む方式 (a)位相操作型 聴覚が比較的位相の変化に鈍感である特性を利用して透かしを入れる方式である。位相

をずらすと電子透かしが入っている。ずらさないと電子透かしが入ってない、という方法

で埋め込みが可能となる。絶対位相の変化に対して、耳は感度が鈍いため電子透かしを聞

き取ることは出来ない。 (b)係数直接操作型 DCT(離散コサイン変換)を利用した画像への電子透かしと類似の考え方で、電子透か

しを埋め込む方式である。いったん周波数領域へ変換し、MDCT(変形離散コサイン変換)

係数を電子透かし情報に基づき人為的に操作変更し、時間軸領域へ逆変換して戻し、透か

しの埋め込まれたデータを得る。係数操作の方法は様々な方法が考案されており、人為的

な量子化幅を導入する方法、係数を群に分類して相対的なエネルギー比で電子透かしを埋

め込む方法等多数あり、強度と密接な関係がある。 (c)スペクトル拡散利用型 原音を周波数領域に変化し、透かしを加えて、逆拡散により元へ戻す方式。スペクトル

拡散も直接拡散と周波数ホッピングの両者が利用されており、直接拡散をするとホワイト

ノイズが付加されたことと同じになる。周波数ホッピングではフィルタリングなどに比較

的強い電子透かしができるが、音質面でやや悪い傾向がある。 (d)統計的埋め込み型 周波数領域に変化しない方式同様で、音の振幅、位相、周波数、係数間の比率といった

パラメータしか電子透かし埋め込みに使えない。周波数領域で統計的な操作を行なう方法

は、任意に選んだ2個のDCT係数の増減を取る方法がある。

Page 11: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

10

第 4 章 可視型電子透かしシステム

4.1 通常の電子透かしと可視型電子透かしとの違い

はじめに可視型電子透かしとはデジタルコンテンツから透かし情報を検出した際に、人

間が視覚的に確認することが出来る電子透かしである。3-2 で述べた音楽データに対する電

子透かしの埋め込み法は様々であるが、一般的な透かし情報は著作者の生年月日などや ID番号などの英数字である。それに対し、今回の可視型電子透かしは透かし情報として画像

を用いている。この二つの方式の大きな違いはデジタルコンテンツから電子透かしを検出

した際、前者の場合では英数字などの文字列の情報が取り出されるが、後者の場合では画

像ファイルとして取り出される。すなわち、後者の場合では視覚的に確認出来る電子透か

しが取り出されるわけである。

4.2 可視型電子透かし

4.2.1 可視型電子透かし埋め込み法

以下にデジタル音楽への可視型電子透かしの埋め込み方法について説明する。

(a) まず、著作権を明示するために、M×N の2値画像を用意する。 そして、この画像データに収まっている白黒のデータ )( nmb , に それぞれ白=1、黒=0という値を割り当てる。

(b) 次に k ビットに量子化された音楽データを ( )tS とする。 ここで t とは標本時刻を指す。

(c) 音楽データ ( )tSi と画素 )( nmb , について埋め込み後 音声データ ( )tSi ' を次式で定義する。ここで i は ( )tS を2進数に変換した際のビットの位置を表している。 ただし、 10 −≤≤ ki である。

( ) ( ) )(( )

=

=

1,0

0,'

nmbif

nmbiftStS i

i (1) 図4.2.1 BMP画像(白黒)

また、標本時刻 t は画素 )( nmb , を満たす整数になっている。 mMnt +⋅= (2)

ただし、 10 −≤≤ Mm , 10 −≤≤ Nn である。

黒=0

白=1 M

b(0,0)

Page 12: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

11

このように ( )tS の値を制御して埋め込み後音声データ ( )tS ' を合成する。そして埋め込む

画像1枚を1フレームとし、音声データに繰り返し埋め込みを行うのである。

4.2.2 透かし検出法

ここでは埋め込み後音声データから透かし情報を検出する方法を説明する。

(a) 埋め込み後音声データ ( )tS ' から埋め込みを施したビットの位置 ( )tSi ' を複合する。

そして、抽出画像 )( mmb ,' と ( )tSi ' の関係は ) ( )( tSnmb i ',' = (3)

となる。ただし

=

⋅−=

Mtn

nMtm (4)

(b) この方法に従って1フレーム分の )( mmb ,' を得ることが出来た時、それを 2 値画像

として表示する事により、人間が視覚的に確認出来る電子透かしが検出された事に

なる。

Page 13: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

12

4.3 システム概要

ここでは可視型電子透かしシステムの概要について説明する。このシステムは電子透

かしを埋め込む電子透かし挿入部と電子透かしを検出する電子透かし検出部の2部から

成り立っている。電子透かしの埋め込み及び検出アルゴリズムは岩切了によって[1]で提

案している方式に従った。なお、本システムで用いる音楽ファイルは WAVE フォーマッ

トで透かし情報として埋め込む画像には白黒の BMP フォーマットを用いている。ここで、

図 4.3.1 はシステムの流れを示したものである。まず、電子透かし挿入部では音声データ

に対し画像データを埋め込み、画像すなわち著作者情報を含んだ音声データが生成され

る。そして電子透かし検出部ではその画像を埋め込んだ音声データから画像を抽出する

事により著作者情報を視覚的に確認する事が出来るのである。

図 4.3.1 システムの流れ

音声データ音声データ

AA画像データ

画像埋め込み

AA抽出画像

画像抽出画像埋め込み

電子透かし挿入部 電子透かし検出部

埋め込み後音声データ

A

埋め込み後音声データ

AA

Page 14: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

13

4.4 システム実装

本システムはユーザーに面倒なコマンドなどの負担がかからないように Java の Swing

コンポーネントを用いてユーザーインターフェースは GUI で実装した。また、ユーザーが

埋め込みか抽出かどちらの作業を行っているのか混乱しないように実装にはタブを使用し、

画像埋込タブ、画像抽出タブというようにそれぞれに作業画面を用意した。 (1) 電子透かし埋め込み画面 図 4.4.1 は電子透かし埋め込み画面である。以下にデジタル音楽データに対し、画像す

なわち電子透かしを埋め込む方法を示す。 ① 電子透かしの埋め込みの対象となる WAVE ファイルを選択する。 ② WAVE ファイルに対し、埋め込む電子透かしすなわち BMP ファイルを選択する。 ③ WAVE データの何ビット目に埋め込みを行うのか選択する。 ④ 画像埋め込みボタン(※)のクリックによりダイアログが出現し、保存ファイル名を入

力し(デフォルトでは先頭に Sukashi の文字がくっついたファイル名になっている)、

その後、埋め込むのか中止するのか最終確認ダイアログが出現し、「はい」を選ぶと埋

め込みが開始される。 ※ このボタンは WAVE ファイル、BMP ファイル両方選択した後に限り使用出来る

図 4.4.1 埋め込み画面

①④

※使用可能に!!

音楽ファイル 画像ファイル 両方選択後

Page 15: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

14

(2) 電子透かし抽出画面 図 4.4.2 は電子透かし抽出画面である。以下に透かしを埋め込んだデジタル音楽から電子

透かしすなわち画像を抽出する方法を示す。 ① 電子透かしが埋め込んである WAVE ファイルを選択する。 ② ①で選択した音楽ファイルに埋め込んだ画像と同じフォーマットで同じ大きさのBMP

ファイルを選択する。 ③ WAVE データの何ビット目から画像の抽出を行うのかを選択する。 ④ 画像抽出ボタン(※)のクリックによりダイアログが出現し、保存ファイル名を入力し (デフォルトでは先頭に Chushutu の文字がくっついたファイル名になっている)、 その後、抽出するのか中止するのか最終確認ダイアログが出現し、「はい」を選択する

と抽出が開始される。 ※ このボタンは WAVE ファイル、BMP ファイル両方選択後に限り、使用出来る

図 4.4.2 抽出画面

④③

※使用可能に!!

音楽ファイル 画像ファイル 両方選択後

Page 16: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

15

4.4 システム仕様

本システムはデジタル音楽データに対し、画像データを埋め込み、さらにその画像デ

ータを埋め込んだデジタル音楽データから埋め込んだ画像データを抽出出来るシステム

である。

1. 開発仕様 開発ツール名 Monties 開発 OS Windows XP Professional Edition 開発言語 Java(TM) 2 SDK, Standard Edition Version 1.4.2

2. 基本仕様

対応音声フォーマット WAVE(量子化ビット数 8 ビット) 対応画像フォーマット BMP(モノクロ画像)

3. 基本機能

1 電子透かし(画像)埋め込み機能 2 電子透かし(画像)抽出機能 3 WAVE ファイル再生機能

4. 開発画面仕様

図 4.5.1 開発画面1

Page 17: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

16

図 4.5.2 開発画面2

表 4.5.1 各部機能紹介 番号 名称 機能 ① 画面切り替えタブ 作業画面を切り替える ② WAVE ファイル選択ボタン WAVE ファイル選択ダイアログを出現させる ③ WAVE ファイル詳細表示ボタン WAVE ファイルの詳細データを表示する ④ WAVE ファイル再生・停止ボタン WAVE ファイルのプレイヤー機能 ⑤ BMP ファイル選択ボタン BMP ファイル選択ダイアログを出現させる ⑥ 埋め込みビット選択ボックス 埋め込みビットを選択出来る ⑦ 画像埋め込みボタン WAVE ファイルに BMP ファイルを埋め込む ⑧ 結果表示エリア 埋め込みや抽出の結果を表示させる ⑨ 抽出ビット選択ボックス 抽出ビットを選択できる ⑩ 画像抽出ボタン WAVE ファイルから BMP ファイルを抽出する

⑨ ⑩

Page 18: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

17

第5章 実験内容及び実験結果

5.1 目的

本実験の目的は聴覚実験及び透かし耐性実験を通して、WAVE ファイルに対し BMP ファイルの白黒画像を何ビット目に埋め込めばよいか、また白黒画像が持つ白画素の数は

どれくらいがよいかを求める。

5.2 実験項目

5.2.1 可視型電子透かし認識試聴実験 5.2.2 透かし情報耐性評価実験

5.3 理論

WAVE ファイルに BMP ファイルを埋め込む方法は 4.3.1 節で説明してある。この方法で

埋め込むと最も音質に影響が出ないのが全て黒な画像である。だがそれでは透かし情報と

して意味を成さないので、白を組み合わせてなんらかの著作者画像を構成する必要がある。 ここで透かしを埋め込むターゲットとなる WAVE ファイルは 8 ビットで量子化されている。 最初に透かしを埋め込むことによって音質面に発生する影響を述べる。まず 1 ビット目に

透かし情報を埋め込むとなると白画素によって WAVE データの最下位ビットが 1→0 に変

更される。この程度では音質には影響は少ないが、2 ビット・3ビット・・・5ビット・・・

8ビットと上げていくにつれて音質の劣化は激しくなっていく。これに対し、透かし耐性

の面からみると MP3 圧縮等の変化などを加えられた場合、1 ビット目のような最下位ビッ

トに透かしを埋め込んだ場合ではデータの変更が最も激しいビット目であるので透かし情

報の検出は難しくなる。音質面の影響とは逆に耐性面から見ると、8 ビット・7ビット・・・ 4ビット・・・1ビットという順番に透かし耐性が弱くなっていく。

Page 19: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

18

5.4 実験方法

5.4.1 可視型電子透かし認識試聴実験

実験1 CLASSIC・POPS に同じ署名画像を埋め込み、音楽の種類によって透かしの影

響度がどれほど違うのか視聴実験により比較する。 方法 1. CLASSIC・POPS の 2 曲に対し同じ画像(B 788)を 1~4 ビット目に埋め込む。

2. 最初に被験者に CLASSIC の原曲を聴いてもらう、その後 1~4 ビット目に透かしを埋

め込んだ CLASSIC を順番に聴いてもらい、音質に変化を感じれば透かしを認識、音

質に変化を感じなければ不認識というようにアンケートをとる。

3. 次に POPS に対しも、CLASSIC と同様の手順でアンケートをとる。

4. 1~4 ビット目における CLASSIC と POPS の透かし認識率の差を比較する。

実験2 POPS に対し白画素数の異なる画像3枚を 1~4 ビット目に埋め込み、音質・透

かし耐性の両面を考慮して、白画素数はどれくらいがよいか、また何ビット目

がよいか検討する。

方法 1. POPSに対し白画素数の異なる3枚の画像(A),(B),(C)をそれぞれ1~4ビット目に埋め

込む。

2. 最初に被験者に POPS の原曲を聴いてもらう、その後(A)の画像を埋め込んだ POPSを 1~4 ビットの順に聴いてもらい、音質に変化を感じれば透かしを認識、音質に変

化を感じなければ不認識というようにアンケートをとる。

3. その後、B の画像、C の画像を A の画像の場合と同様の手順でアンケートをとる。

Page 20: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

19

5.4.2 透かし耐性評価実験

実験 3

方法

1. 可視型電子透かし認識視聴実験で透かしを埋め込んだ POPS に対し、MP3

圧縮を行う。MP3 圧縮を行う時のビットレートは 128kbps と 320kbps の二つ用い

る。

2. MP3 に圧縮したファイルをまた元の WAVE ファイルに戻し、そして透かし情報の 検出を行い、なにもファイルに変化を加えないで抽出した場合と MP3 に圧縮した後

また元に戻して抽出した場合とではどれほど透かし情報が劣化してしまっているか

研究者自身の視覚的判断により比較する。

5.4.3 実験環境

1、使用する実験音楽と署名画像

(ア) 曲目 計2曲(WAVE ファイル 量子化ビット数 8 ビット) [CLASSIC] ベートーベン - 運命 [POPS] t.a.t.u - All The Things She Said.

(イ) 署名画像 計 3 枚

白画素数 A 198 B 788 C 2500

図 5.4.1 署名画像(256×256)

Page 21: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

20

2、実験配置

スピーカーと被験者の位置関係を図 5.4.2 に示す。

3、使用するコンピュータとソフト

コンピュータ

CPU celeron 650 MHz

RAM 256 Mbyte

OS MicroSoft Windows XP Professional

再生ソフト

Windows Media Player

MP3 エンコードソフト

SCMPX

図 5.4.2 実験配置

電子透かしソフト

Monties

スピーカースピーカー

Page 22: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

21

5.5 実験結果

可視型電子透かし試聴実験

0

20

40

60

80

100

0 0.5 1 1.5 2 2.5 3 3.5 4

埋め込みビット目

認識

CLASSIC POPS

図 5.5.1 CLASSIC・POPS の可視型電子透かしの認識率の違い

図 5.5.2 POPS における画像の白画素数の違いによる認識率の違い

0

20

40

60

80

100

0 1 2 3 4

埋め込みビット目

認識

198[bit] 788[bit] 2500[bit]

Page 23: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

22

可視型電子透かし試聴実験(失敗実験)

図 5.5.3 POPS に対し同じ実験環境及び実験条件で埋め込みを行った結果

0

20

40

60

80

100

0 1 2 3

埋め込みビット目

認識

POPS① POPS②

Page 24: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

23

透かし耐性評価実験

表 5.5.1 白画素数 2500 個の場合 検出ビット目 変化なし MP3 圧縮(320kbps) MP3 圧縮(128kbps)

1 ビット目

2 ビット目

3 ビット目

4 ビット目

※変化なし - ファイルに何も変化を加えずに検出した画像 ※MP3 圧縮 - ファイルを一旦 MP3 圧縮し、また元に戻して検出した画像 (かっこの中の数字はビットレートを表している)

Page 25: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

24

表 5.5.2 白画素数 788 個の場合 検出ビット目 変化なし MP3 圧縮(320kbps) MP3圧縮(128kbps)

1 ビット目

2 ビット目

3 ビット目

4 ビット目

※変化なし - ファイルに何も変化を加えずに検出した画像 ※MP3 圧縮 - ファイルを一旦 MP3 圧縮し、また元に戻して検出した画像 (かっこの中の数字はビットレートを表している)

Page 26: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

25

表 5.5.3 白画素数 198 個の場合 検出ビット目 変化なし MP3圧縮(320kbps) MP3 圧縮(128kbps)

1 ビット目

2 ビット目

3 ビット目

4 ビット目

※変化なし - ファイルに何も変化を加えずに検出した画像 ※MP3 圧縮 - ファイルを一旦 MP3 圧縮し、また元に戻して検出した画像 (かっこの中の数字はビットレートを表している)

Page 27: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

26

第 6 章 考察 今回、岩切了によって[1]で提案されているアルゴリズムを使用し、WAVE データに対し、

著作者を示す BMP 画像を埋め込む可視型電子透かしシステムを Java 言語を用いて実装し

た。そして、今回の目的である WAVE データに対しどのビット目、またどのような白黒の

BMP 画像を埋め込めば音質・透かし耐性の両面を満足させる事が出来るのか可視型電子透

かし認識試聴実験及び透かし耐性評価実験のそれぞれの結果より考察・検討する。 まず可視型電子透かし試聴実験の実験1の結果、図 5.5.1 より音楽の種類によって透かし

の認識率が違うという事が判明した。埋め込みは1~4ビット目まで行なった結果、CLASSICは POPS に比べ、透かし認識率が 1.43 倍高い結果となった。被験者達に透かしが入った音

楽について問うと、演奏初めの所のノイズがわかりやすいという返答が多かった。これは

やはり CLASSIC は無音状態や小さな音の演奏時間が POPS より比較的多いのが関連して

いると言える。 次に可視型電子透かし認識試聴実験の実験2の結果(図 5.5.2)及び透かし耐性評価実験

結果(表 5.5.1~3)より、埋め込みビット目と透かしの情報量について考える。基準として

は音質面は被験者の過半数が透かしを認識できなければ満足とし、透かし耐性面では研究

者自身が視覚的に判断し、透かし画像を確認出来るか否か判断する。まず図 5.5.2 より埋め

込みビット目が 3 ビット目以上となると白画素数に関係なく過半数以上が透かし入りと認

識できてしまうという結果になった。よって、埋め込みビット目は最高でも 2 ビット目と

いう結論になる。またこの図 5.5.2 ではやや理論とは異なっている結果となってしまった。

本来ならば、白画素数が多ければ多いほどノイズが発生し、透かしが認識しやすくなるの

だが今回の実験結果では、白画素数が 788個より 198個の方が認識率が高かったのである。

この結果については私自身、理解出来ないので検討は差し控える。それでは次に、透かし

耐性面について考える。最初に音質面の実験結果より 3 ビット目以上は考慮しない事にす

る。透かし耐性評価実験の結果の表 5.5.1~5.5.3 を見てみると、白画素数に限らず 1 ビット

目に埋め込んだ時では MP3 圧縮を行なった場合、圧縮率が 320kbps でも 128kbps でもほ

ぼ完全に透かし情報を認識する事は難しいと言える。それでは 2 ビット目について一つず

つ見ていく事にする。まず白画素数が2500個の場合では乱れがあるものの認識できない程、

劣化していないと言える。788 個の場合では 320kbps では微かに認識できるが 128kbps で

はほぼ認識できない程劣化してしまっている。198 個に関しては 788 個と同様、320kbpsでは微かに認識できるが 128kbps ではほぼ認識できない程劣化してしまっている。結論と

しては埋め込みビット目は 2 ビット目が妥当であると言える。しかし、埋め込む白画素数

に関しては今回の実験内容からでは断定は難しいが、最低でも透かしに耐性を持たせるた

めに 1000 個は必要であると考える。

Page 28: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

27

可視型電子透かし認識試聴実験(失敗実験)について 図 5.5.3 は POPS に対して同じ環境及び同じ条件で埋め込みを行ない、透かし認識実験を

行なった結果である。POPS①、POPS②は同じ曲で同じ画像を埋め込んでいた。だが結果 はまったく異なったものとなってしまった。なにより、不思議なのが POPS①に関して 3 ビット目に埋め込んだものが一番認識されなかったという点である。この事から被験者は 再生されている曲がただのスピーカーのノイズなのか透かし入りなのかどうか曖昧なまま、 実験に望んでいた可能性が高いと言える。これは実験を行なった私自身の反省すべき点で あり、その次に行った実験ではこの点を考慮し、再実験に望んだ。

Page 29: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

28

第 7 章 参考文献 [1] 岩切宗利、松井甲子雄「デジタル音楽への電子透かしの可視化法」

情報処理学会論文誌、Vol.41、No.6、pp.1840 – 1847、2000 [2] 小野 束、「電子透かしとコンテンツ保護」

オーム社、p139~168

Page 30: 2003 年度 卒業論文 デジタル音楽への可視型電子透かし ...windy.mind.meiji.ac.jp/paper/2003/thesis/Monties_thesis.pdf3 第1章 序論 1.1 研究背景 近年、インターネットの高速化により大容量のファイルの高速なダウンロードが可能に

29

謝辞 本研究を遂行するにあたって、多くの方々から御指導、御激励を受け賜りました。特に本

研究を遂行するにあたり、多大なる御指導を賜りました、東海大学工学部情報メディア学

科 菊池浩明助教授に深甚なる感謝を申し上げます。 また、本研究を推進するにあたり、御懇切なる御指導を賜りました、東海大学工学部情

報科学科 中西祥八郎教授に深甚なる感謝を申し上げます。 また、本研究を推進するにあたり、御懇切なる御指導を賜りました、東海大学工学部情

報科学科 内田理講師に深甚なる感謝を申し上げます。 さらに本研究を推進するにあたり、多大なる御指導を賜り、本研究を導いて頂きました、

東海大学大学院工学研究科電気工学専攻博士課程前期 大学院生 斉藤雅之氏、中里純二

氏、酒田晋吾氏、高崎勲氏に厚く感謝を申し上げます。 最後に1年と半年ほどの短い期間で楽しい時、辛い時を共に過ごし、本研究の評価実験で

御協力頂きました電気第5研究室 同期の学部生の方々をはじめ、様々な方々に心から深

く感謝を申し上げます。