От | Dervish |
К | Офф-Топик |
Дата | 17.04.2008 00:36:51 |
Рубрики | Современность; Политек; |
Ой сомневаюсь
День добрый, уважаемые.
>типа "несколько слов - характерный диктор" "одно слово - несколько дикторов" (слово несколько следует понимать как счетно)
В начале 1990-х досаточно известный в ИИ-кругах Д.А. Поспелов в неформальной беседе полжительно оценивал возможность уверенного распознвания порядка 200-300 слов незаисимо от говорящего.
И это 16 лет назад...
С уважением - Dervish
Dervish (17.04.2008 00:36:51)От | Сергей Зыков |
К | |
Дата | 17.04.2008 01:49:48 |
Re: Ой сомневаюсь
http://offline.computerra.ru/2008/729/353888/
Драконья погибель
Автор: Александр Бумагин
Опубликовано в журнале "Компьютерра" №13 от 08 апреля 2008 года
Каждый журналист мечтает о том, чтобы прийти после встречи, подключить диктофон к компьютеру и открыть весь разговор непосредственно в текстовом редакторе. На деле же приходится тратить уйму времени на расшифровку аудиозаписи. Автоматизации это процесс поддается плохо, если, конечно, у вас нет расторопной прислуги. Да и просто наговаривать тест, отложив клавиатуру, хочется еще со школьных лет. Фантастика? Специалисты питерского Центра речевых технологий полагают, что нет.
Формальным поводом для этой статьи послужило заявление питерского Центра речевых технологий (ЦРТ) о завершении работы над технологией распознавания слитной русской речи.
Сергей Зыков (17.04.2008 01:49:48)От | doctor64 |
К | |
Дата | 17.04.2008 13:51:21 |
Re: Ой сомневаюсь
>Формальным поводом для этой статьи послужило заявление питерского Центра речевых технологий (ЦРТ) о завершении работы над технологией распознавания слитной русской речи.
Я такие сообщения помню с 95 года, с выхода IBM OS/2 Warp 4 со встроенным VoiceType.
Dervish (17.04.2008 00:36:51)От | Офф-Топик |
К | |
Дата | 17.04.2008 00:58:49 |
Ну на уровне алгоритмов конечно .. А вы попробуйте реализовать
>День добрый, уважаемые.
>>типа "несколько слов - характерный диктор" "одно слово - несколько дикторов" (слово несколько следует понимать как счетно)
>
>В начале 1990-х досаточно известный в ИИ-кругах Д.А. Поспелов в неформальной беседе полжительно оценивал возможность уверенного распознвания порядка 200-300 слов незаисимо от говорящего.
>И это 16 лет назад...
Никто не спорит про принципаильные возможности - вы в железе да еще не в абстрактном а совместимом с рещающим задачи радиоразведки, ПТП или записи попробуйте все маштабно и безотказно делать...
Я помню систему распознавания на базе ЕС 10 с чем то там -умерла вместе с линией.
И товарищ Диков насколько мне не изменяет память тоже не последний человек :-) в обработке речи :-) ЦРТ когда-то ???
Офф-Топик (17.04.2008 00:58:49)От | Андрей Диков |
К | |
Дата | 19.04.2008 02:30:32 |
Re: Ну на...
День добрый!
Предпоследний. Я не был тех.специалистом. Но работал там когда-то.
Там большие специалисты работают и, афаик, лучшие в стране в этой области, но все что я хотел сказать это то, что эти технологии очень сложны в разработке и особенно отладке.
Февральская новость - это конечно серьезная заявка, еще несколько лет назад этого не было (но работали над этим). Тогда было пословное распознавание и перспективным считалось пофонемное, о чем видимо сейчас речь и идет. Но, могу только предположить, что пока речь идет о поиске с некоторой точностью места в фонограмме хорошего качества.
На практике, в реальности, поиск необходимо проводить в низкокачественном жатом материале - тот же гсм, и с помехами. Не говоря уже о собственно плохой речи, дикции, акценте, диалектах и т.п. Это большие трудности для практической реализации и тем более массового внедрения на практике в том виде, в котором это представляется обществу. Имхо еще лет пять биг бразер будет не настолько биг.
С уважением, Андрей
Офф-Топик (17.04.2008 00:58:49)От | Dervish |
К | |
Дата | 17.04.2008 01:11:40 |
Я спрашивал именно о практической реализуемости, но раз не было - так не было
День добрый, уважаемые.
>Никто не спорит про принципаильные возможности - вы в железе да еще не в абстрактном а совместимом с рещающим задачи радиоразведки, ПТП или записи попробуйте все маштабно и безотказно делать...
Я спрашивал именно о практической реализуемости, но раз не было - так не было.
С уважением - Dervish
Dervish (17.04.2008 01:11:40)От | Офф-Топик |
К | |
Дата | 17.04.2008 01:38:14 |
Я вам ответил но коряво счас сформулирую - да есть ряд систем состоящих на снабж
жении и опытно-боевой эксплуатации в радиоразведке ФСБ, в военной разведке и в специальной технике ФСБ - решающих разные задачи - задачка типа "поиск ключевого слова" не самая главная и важная кстати
В МВД же надеются решить задачу автоматической идентификации диктора по голосу - для чего полным ходом создается задел фонограмм подозреваемых, обвиняемых, ложных звонков туда же сольют все записи звонков в ДЧ и ОДС
Офф-Топик (17.04.2008 01:38:14)От | Офф-Топик |
К | |
Дата | 17.04.2008 01:39:03 |
Впрочем писать впрок полезно - потому что можно будет запустит ретроспеективный
поиск и словать некую масштабную волну реализаций и подвисших уголовных дело