vesnat.ru страница 1
скачать файл
Константин Ламин, генеральный директор

lamin@speereo.com

Олег Малеев, к.т.н., директор по научно-исследовательским разработкам

maleev@speereo.com

О нашей компании

Компания SPEEREO SOFTWARE была основана в 1998 году. Это исследовательская компания, которая создавалась под конкретный проект, имевший ясную стратегию развития. В компанию инвестировались только частные средства. Следует отметить, что если для Запада это обычная практика, то для России сегодня такая модель научно-исследовательских проектов – не частое явление (как впрочем, было и в 1998 году). Результаты проекта интересны и важны как сами по себе, так и в силу того, что история нашей компании высвечивает ряд возможностей и недостатков, присущих российскому высокотехнологическому сектору.


Для основателей SPEEREO SOFTWARE с самого начала было очевидно – техника становится все сложней, все сложнее становиться управление ею. И это касается не только истребителей и суперкомпьютеров, но и обычных бытовых устройств: автомобильной электроники, телефонов, телевизоров и т.п. Современный человек сталкивается со все более сложными меню, обилием кнопок и многостраничными инструкциями. Взаимодействие человека с машиной, повсеместно основанное на кнопках и пиктограммах, стремительно устаревает. Выход уже давно нашли писатели – фантасты. Их герои непринужденно используют речевой интерфейс.

О продукте

Человек устроен так, что выражать свои мысли ему удобней словами. При этом говорит он быстрее, чем пишет или печатает на компьютере. Мы понимали, что появись возможность речевого управления машиной, разработчики всего окружающего нас электронного многообразия восприняли бы ее «на ура». Такие системы нужны как в быту (кто из нас не хотел бы вместо вечно теряющегося пульта ДУ просто управлять телевизором с помощью голоса?), так и в промышленности, где голосовое управление позволяет добавить еще один информационный канал в человеко-машинном интерфейсе. Дело было за малым – создать технологию такого управления. Мы сосредоточились на создании командной системы.


Задача оказалась не из легких. Достаточно сказать, что систему со столь высокими параметрами не смогли создать ни в IBM, ни в Microsoft, ни в десятках других компаний и университетов. Может быть, им это и не нужно? Но как тогда объяснить исследовательские бюджеты в десятки миллионов долларов?
Дело в том, что для создания такой системы требуется вести исследования на стыке нескольких областей науки, используя достаточно сложный математический аппарат. Такому проекту необходимы уникальные люди, обладающие широким кругозором и способностью к творчеству. А это как раз то, чем сильны российские ученые.
Можно считать успешное решение подобной глобальной задачи в нашей небольшой фирме везением, но мы склонны видеть здесь определенную закономерность. Там, где молодым и амбициозным российским ученым созданы нормальные условия – они способны творить чудеса (см. подробнее о самой технологии). И одно чудо уже произошло – создана не имеющая в мире аналогов система распознавания речевых команд. Причем при затратах на порядок меньших, чем в аналогичных проектах! Happy end? Ничуть! Все только начинается.

О рынке

Следующая наша задача - выйти на массовый потребительский рынок США, Канады, Великобритании и Австралии. К сожалению, центры принятия решений для электронной промышленности находятся не в России. И наша компания ориентирована, в первую очередь, на западный рынок, как на более емкий и технологически развитый.


Каковы его перспективы?
У нас на глазах рождается рынок интерфейсов для мобильных телефонов, автомобилей, бытовой техники. Рост его затмевает любые нефтяные котировки. Достаточно сказать, что к 2007 году количество смартфонов (телефонов, оснащенных миникомпьютером) достигнет 800 млн.! Обнадеживающая особенность этого рынка заключается в том, что на нем операционная система Microsoft не доминирует. То есть, это конкурентный, а значит - развивающийся рынок. Управление навигационными автомобильными комплексами востребовано уже сегодня. Управление бытовой техникой и домашней связью с помощью голоса – другое направление нашей деятельности. Количество жилищ для внедрения такой системы исчисляется десятками миллионов. На всех этих рынках SPEEREO предлагает готовые программные и аппаратные решения для конечных потребителей. Эти продукты не перекроют весь рынок, но будут проводниками наших идей на нем.


О компаниях больших и маленьких

Для продвижения технологии необходимы ресурсы, значительно более мощные, чем затрачены на ее создание. Недостаточно просто проинформировать возможных покупателей о том, что такая технология появилась. Нужно еще и показать, как она работает, в чем ее преимущества, продемонстрировать ее возможности для конкретного устройства. Поначалу мы рассчитывали найти крупных партнеров на Западе. Однако наше идеалистическое восприятие западных корпораций быстро развеялось.


Выяснилось, что в огромных бюрократических структурах людей, принимающих решения - единицы. Внедрение инноваций в этих корпорациях тоже дело весьма редкое.
Договориться было трудно еще и потому, что мы не стремились получить «хоть что-нибудь» или продать компанию полностью. Мы пришли в бизнес всерьез и надолго. Это не та ситуация, когда удачно приватизированное «ноу-хау» хочется продать как можно быстрее. Наша технология была создана непосредственно самими участниками проекта. Свое дело, да еще и с вложениями собственных средств (а это миллионы долларов), предполагает совершенно иные подходы. Мы - не перепродавцы, а создатели. Сегодняшняя рыночная ситуация и уникальный технологический задел позволяют нам рассчитывать на многое. Да и какой смысл ждать, пока «монстры» раскачаются и начнут замечать очевидные для всех перемены? Не лучше ли воспользоваться ситуацией и отхватить у них приличный кусок рынка!
Тем-то и хорош высокотехнологический сектор: изменения в нем происходят настолько активно, что целые отрасли находятся в состоянии постоянной трансформации. Маленькие и хорошо управляемые компании имеют возможность выдвинуться на первые роли. Всякий скептицизм относительно новой технологии у больших корпораций исчезает, если потребители расхватывают созданные на ее основе продукты, как горячие пирожки…
Самые расторопные гиганты индустрии уже заявили о поддержке наших начинаний, и эта составляющая продвижения технологии, наконец, сдвинулась с мертвой точки.


О знаках признания

Программный продукт компании был признан лучшим речевым продуктом 2003 года. Это – мнение авторитетного американского издания PocketPC Magazine. Журналом «Эксперт» наша компания названа «лучшим инновационным проектом 2004 года». На 4-й российской венчурной ярмарке она была отмечена дипломом “За успехи на внешнем рынке”. Но самое важное - не было ни одного случая возврата товара пользователями! За нами - одно из самых высоких в отрасли количество покупателей на сотню показов демо-версий. Это говорит о том, что потребители прекрасно воспринимают новую технологию – видимо, хорошо подготовлены Sci-fi литературой и фильмами.


Да, успешный массовый продукт – дело не одного месяца, но очевидные успехи налицо.


О планах

Все хорошо, но скорость роста компании не устраивает ее основателей. Поэтому было принято решение о том, чтобы привлечь венчурного инвестора на приемлемых для компании условиях. Переговоры еще идут, но мы не сомневаемся в успехе. В кого еще вкладываться в российском хай-теке, если не в нас?


Технология распознавания слитной речи Speereo Software
Речевой интерфейс позволяет обеспечить наиболее удобное взаимо­действие человека с технической системой. Однако для распространения его на широкий класс устройств необходима уникальная технология, обладающая несколькими важнейшими свойствами.
Во-первых, точность работы системы. Никому не понравиться, если система будет понимать его неправильно. Если технология не обладает достаточной точностью (более 95%), то это лишь игрушка или прототип, но не коммерческая система. Наша технология обеспечивает беспрецедентную точность распознавания. В проводимых экспериментах система в 99,9% случаев понимала произносимые человеком команды. Это значит, что система поймет практически любую правильно произнесенную команду.
Второе требование рынка заключается в том, что система не должна требовать подстройки к конкретному диктору. В ряде случаев такую подстройку выполнить просто невозможно (например, в публичных информационных киосках, когда диктор заранее неизвестен). Однако и в других ситуациях подстройка обременительна для пользователя. Кроме того, дикторонезависимость означает определенный показатель уровня технологии и гарантию того, что система будет понимать вас, даже если вы простужены, и у вас изменился голос. Наша технология изначально разрабатывалась, как дикторонезависимая, и в английском варианте уже опробована на всех континентах. Система понимает шотландцев, индийцев, корейцев и других дикторов, для которых английский язык не родной. По этому критерию наша система просто уникальна.
Необходимым условием для широкого использования речевых технологий является увеличение быстродействия систем распознавания речи. Повышение быстродействия особенно важно при внедрении систем распознавания с большими словарями в контроллеры устройств, поскольку во встроенных системах ресурсы процессоров сильно ограничены. Здесь мы добились очень хороших результатов и наша полноценная система дикторонезависимого распознавания слитной речи может работать на любом RISC процессоре производительностью от 40 MIPS и требует всего около 2 мб оперативной памяти. Такие характеристики системы позволяют нам смело выходить на рынки мобильных устройств и контроллеров.
Существует еще много показателей, по которым оцениваются подобные системы. Например, гибкость изменения речевых команд. Наша технология позволяет менять речевые команды динамически во время исполнения программы. Словарь системы содержит более 100 тыс. слов. Более того, благодаря специальному модулю, можно распознавать слова, не входившие изначально в словарь системы. Другая важная характеристика - робастность по шуму. Наша технология позволяет уверенно понимать речевые команды в условиях повышенных шумов, в том числе автомобильных.
Несмотря на то, что система сейчас настроена на английский язык, технология с самого начала разрабатывалась с учетом возможной быстрой перенастройки ее на другие языки, в частности, на русский - все-таки это родной язык разработчиков… Эксперименты с русским языком показали, что технология, настроенная на русский язык, будет демонстрировать схожие характеристики с английской версией, а в некоторых случаях даже превосходить ее. Другой вопрос, что такой тюнинг требует серьезных финансовых вложений, и мы ждем, когда российский рынок будет готов к торговле такими системами.
скачать файл



Смотрите также:
О нашей компании
69.11kb.
П роект по продвижению Консалтинговой Компании (далее Компании), включая special event Группа разработчиков
100.31kb.
Социально-ответственный бизнес компании johnson&johnson говор Я. Н., специальность 1-26 02 01 «Бизнес-администрирование»
61.14kb.
Характеристики многофункционального интеллектуального медиа-плеера Android
138.48kb.
Кристоф Навар, Жиль Хеннесси и президент компании "Уайтхолл" Марк Кауфман пригласили представителей прессы в ресторан In Vino
14.92kb.
Ведущий международный оператор мобильной спутниковой связи Thuraya Telecommunications начал работу в России
26.95kb.
Конфликт на шахте "Кыргайская" угольной компании "Прокопьевскуголь"
235.82kb.
Текучесть кадров или ее отсутствие?
66.64kb.
Дать каждому сотруднику представление о миссии, ценностях и принципах деятельности Компании
174.27kb.
Зачем создана рассылка?
14.09kb.
Комитет Законодательного Собрания Нижегородской области по экологии и природопользованию
47.92kb.
Возможна ли перестройка на зерновом рынке России? Хищения, низкое качество госзерна и дисбаланс его запасов в регионах заставили вр и. о гендиректора Объединенной зерновой компании (озк)
30.68kb.