Форум русскоязычного сообщества Ubuntu


Хотите сделать посильный вклад в развитие Ubuntu и русскоязычного сообщества?
Помогите нам с документацией!

Автор Тема: Как кодируется звук?  (Прочитано 961 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Ururu_2

  • Автор темы
  • Активист
  • *
  • Сообщений: 290
    • Просмотр профиля
Как кодируется звук?
« : 08 Апрель 2010, 13:08:10 »
Вот есть звуковая волна. Она имеет амплитуду и частоту. Амплитуда отвечает за громкость, частота, как я понимаю, за тембр. НО! Когда мы слышим песню, мы ведь слышим слова и голос. Как это кодируется?
Чтобы было понятнее:
1. Мужским и женским голосами произнесли "Алё". Чем будут отличаться звуковые волны?
2. Одним и тем же голосом произнесли "Ubuntu" и "Линукс". Чем будут отличаться звуковые волны?

Как я понимаю, тема эта разрабатывалась, ведь есть же и проги, синтезирующие речь (а значит, есть алгоритмы "выработки звуков с нужными словами") и проги, с помощью которых криминалисты могут определить, чей голос записан.

Посоветуйте какие-нибудь книги на данную тему. Ну или на крайний случай проги с открытым кодом, в которых есть вышеописанные функции.

Оффлайн baklan

  • Активист
  • *
  • Сообщений: 386
    • Просмотр профиля
    • backline
Re: Как кодируется звук?
« Ответ #1 : 08 Апрель 2010, 13:20:19 »
Вот есть звуковая волна. Она имеет амплитуду и частоту. Амплитуда отвечает за громкость, частота, как я понимаю, за тембр.
Неправильно понимаете. За тембр отвечает набор частот со своими амплитудами. Это уже физика+математика. Разложение на спектр. Без понимания физико-математических основ не стоит идти дальше. Ну а источник - учебник физики и математики. Вообще тема интересная, когда-то тоже увлекался, когда еще компов не было. Вот тоже вопрос - один аккорд минорный, другой мажорный, а ведь всего лишь один из входящих звуков изменился на полтона. Видимо к физике и математике нужно еще и физиологию, а там еще что-то прицепится. Сложно, но интересно.  
« Последнее редактирование: 13 Апрель 2010, 07:20:55 от baklan »

Оффлайн inikakinache

  • Новичок
  • *
  • Сообщений: 12
  • Оправдывать глупости
    • Просмотр профиля
Re: Как кодируется звук?
« Ответ #2 : 08 Апрель 2010, 13:42:18 »
Вот есть звуковая волна. Она имеет амплитуду и частоту. Амплитуда отвечает за громкость, частота, как я понимаю, за тембр. НО! Когда мы слышим песню, мы ведь слышим слова и голос. Как это кодируется?
Если грубо то, например, характеристики звука 16bit (1) / 44KHz (2):

65536 (1)  различных вариантов "трещалок"(уровней) и генерация их в различной последовательности с частотой ~44000раз/сек (2) дают вам возможность наслаждаться Моцартом в вагоне метро :)

Оффлайн Ururu_2

  • Автор темы
  • Активист
  • *
  • Сообщений: 290
    • Просмотр профиля
Re: Как кодируется звук?
« Ответ #3 : 08 Апрель 2010, 13:57:31 »
Поэтому и спрашиваю, что почитать по теме. Желательно в приложении к программированию.

Оффлайн Lucius

  • Новичок
  • *
  • Сообщений: 25
  • kubuntu 10.10 x64 + calculate-linux 10.9 x86
    • Просмотр профиля
Re: Как кодируется звук?
« Ответ #4 : 08 Апрель 2010, 14:03:43 »
Очень советую ознакомиться с теорией вейвлетов http://ru.wikipedia.org/wiki/%D0%92%D0%B5%D0%B9%D0%B2%D0%BB%D0%B5%D1%82
Там не особо-то тривиально, но для понимания достаточно.
ЗЫ есть даже случай интересный:
Один человек писал докторскую по вейвлетам и не показывал работу своему научнику, чтобы тот не украл идею, потому что этот чувак придумывал революционную систему кодирования :)

Оффлайн pterodaktil

  • Активист
  • *
  • Сообщений: 785
  • "Suum cuique" (Каждому свое)
    • Просмотр профиля
Re: Как кодируется звук?
« Ответ #5 : 08 Апрель 2010, 14:10:57 »
Поэтому и спрашиваю, что почитать по теме. Желательно в приложении к программированию.
Для начала  классический учебник Рабинер и Голд Теория  цифровой обработки сигналов
Ну и здесь посмотреть не мешает
« Последнее редактирование: 08 Апрель 2010, 14:18:47 от pterodaktil »
Одним из примеров громоздкой и бесполезной надстройки является интегрированная система WINDOWS фирмы Microsoft.

(c)Т.Э.Кренкель, А.Г.Коган, А.М. Тараторин. "Персональные ЭВМ в инженерной практике"

Оффлайн Ururu_2

  • Автор темы
  • Активист
  • *
  • Сообщений: 290
    • Просмотр профиля
Re: Как кодируется звук?
« Ответ #6 : 08 Апрель 2010, 14:36:19 »
Господа, это всё немного не то! слова и характеристики голоса в звуковой волне появляются не в результате цифровой обработки, они там есть изначально!
Чтобы было понятнее: задача стоит так: есть пример голоса (звуковой файл) и есть текст. Нужно "вытащить" из звукового файла особенности голоса и "произнести" этим голосом текст.
Ведь есть же программы для синтеза голоса! Должна, значит, быть и литература по теме, описание алгоритмов и т.д.

Оффлайн pterodaktil

  • Активист
  • *
  • Сообщений: 785
  • "Suum cuique" (Каждому свое)
    • Просмотр профиля
Re: Как кодируется звук?
« Ответ #7 : 08 Апрель 2010, 14:41:27 »
http://text2speech.sourceforge.net/
http://www.speech.cs.cmu.edu/festival/download.html
Да, четче формулировать задачу надо.
« Последнее редактирование: 08 Апрель 2010, 14:44:49 от pterodaktil »
Одним из примеров громоздкой и бесполезной надстройки является интегрированная система WINDOWS фирмы Microsoft.

(c)Т.Э.Кренкель, А.Г.Коган, А.М. Тараторин. "Персональные ЭВМ в инженерной практике"

Оффлайн wl

  • Старожил
  • *
  • Сообщений: 1393
    • Просмотр профиля
Re: Как кодируется звук?
« Ответ #8 : 08 Апрель 2010, 16:21:33 »
Чтобы было понятнее: задача стоит так: есть пример голоса (звуковой файл) и есть текст. Нужно "вытащить" из звукового файла особенности голоса и "произнести" этим голосом текст.
Ведь есть же программы для синтеза голоса! Должна, значит, быть и литература по теме, описание алгоритмов и т.д.

Конечно, есть, ворох. Идем в гугл, пишем "voise synthesis" - и получаем кучу ссылок. В конце статьи из Википедии на эту тему есть ссылки и на теоретические научные работы, и на реализации. Ну и дальше, там тоже есть ссылки.

Пользователь решил продолжить мысль [time]Thu Apr  8 14:27:14 2010[/time]:
ЗЫ есть даже случай интересный:
Один человек писал докторскую по вейвлетам и не показывал работу своему научнику, чтобы тот не украл идею, потому что этот чувак придумывал революционную систему кодирования :)
Занятно. А можно узнать название, тему, авторов, ссылки на публикации?
У соискателей степени доктора наук, насколько мне известно, научных руководителей не бывает.
« Последнее редактирование: 08 Апрель 2010, 16:30:25 от wl »
На свете феньки есть такие, брат Горацио, которых лохи просто не секут. (Шекспир, "Гамлет", вольный перевод)

Оффлайн Yurror

  • Старожил
  • *
  • Сообщений: 1966
    • Просмотр профиля
Re: Как кодируется звук?
« Ответ #9 : 08 Апрель 2010, 19:11:10 »
Думаю топикстартер насмотрелся фантастики. Пока задача не решена. Решишь и тебя сразу же скрутят ФБР/ФСБ (кто быстрее успеет) и увезут в свой бункер хе хе =)
Ты бы реально задачку ближе к земле поставил и с понятиями разобрался. А вообще звук кодируется аудио кодеками =)

Оффлайн Ururu_2

  • Автор темы
  • Активист
  • *
  • Сообщений: 290
    • Просмотр профиля
Re: Как кодируется звук?
« Ответ #10 : 08 Апрель 2010, 23:25:07 »
ААА! Не хочу в бункер ФСБ! Там футбол сто процентов не показывают! :)
А с чего ты взял, что не решена? Я нарыл в инете несколько прог, который издеваются над голосом - искажают, преобразуют женский в мужской и т.д. А значит, тема проработана хотя бы отчасти, есть способы редактирования особенностей голоса. Но к сожалению всё, что я нашёл - с закрытым кодом.

Прога text2speech вообще сама нифига не делает, только использует чью-то длл для синтеза голоса.

Оффлайн Yurror

  • Старожил
  • *
  • Сообщений: 1966
    • Просмотр профиля
Re: Как кодируется звук?
« Ответ #11 : 09 Апрель 2010, 17:39:59 »
женский в мужской голос делается понижением тембра. ну в самом примитивном случае просто замедляют воспроизведение если не охота возиться с преобразованием сигнала. это можно не спорю.
Можно из текста делать речь. Но качество... Аля Magick Goody и The Microsoft Sam as the computer default vooooice это слегка не дотягивает до поставленной задачи. не находишь. ну а вообще посмотри orca  c открытыми текстами. читает по русски

Оффлайн bektau

  • Участник
  • *
  • Сообщений: 140
  • US 9.04, US 9.10 , Lucid 10.04 (fix)
    • Просмотр профиля
Re: Как кодируется звук?
« Ответ #12 : 12 Апрель 2010, 23:55:40 »

 

Страница сгенерирована за 0.066 секунд. Запросов: 24.