В октябре единственное подразделение компании
"Intel" в России - "Intel Nizhny Novgorod Lab" (INNL), находящееся в Нижнем Новгороде, намерено представить на корпоративной конференции в головном офисе "Intel" в Калифорнии разработку мультимедийного сотового видеотелефона. Об этом НТА сообщило руководство INNL.
Несмотря на то, что речь идет о присутствии видео, данная разработка основана на создании изображения по заложенной модели. Передача информации осуществляется путем считывания заданных параметров по так называемому стандарту передачи MPEG-4. Смоделированное на экране видеотелефона изображение абонента будет повторять движения реального абонента. При этом разговор могут вести два виртуальных джентльмена в галстуках в то время, как настоящие в момент разговора могут стоять с полотенцем на голове.
Но причиной серьезных работ в этом направлении является не только виртуальность, а возможность решить главную проблему, неразрешимую обычным видео - передачу большого объема информации. Как сказал корреспонденту "Нижегородского телеграфного агентства" руководитель лаборатории обработки мультимедиа INNL Валерий Курякин, мультимедийная передача информации позволяет добиться максимального сжатия информации. "Моделирование вместо передачи натуральных объектов обычным видео позволяет уменьшить объем в 500 раз по сравнению с MPEG-1, и во столько же раз соответственно уменьшается нагрузка на линии передачи (что важно для мобильной связи, обладающей небольшой пропускной способностью - НТА)", - пояснил он.
Сотовый видеотелефон, как подчеркнули в INNL - лишь одно из применений мультимедийных технологий. В нижегородской лаборатории впервые осуществлена полная реализация всего конвейера обработки синтетического видео, начиная от распознавания черт реального лица до анимации его трехмерной модели. Для применения же опытов на видеотелефоне определяющим фактором стала актуальная необходимость сжатия объема информации и экономичности. Последний критерий в результате применения мультимедийной передачи возрастает значительно. В том же, что необходимость в мобильных видеотелефонах будет быстро расти, в лаборатории не сомневаются.
Та или иная модель в таком телефоне может быть как уже заложенной, так и "отправленной" с камеры телефона собеседника. При этом, воспроизведение может осуществляться двумя путями: синхронизацией визем (артикуляции) и фонем (звуков), а также анимацией распознанной мимики лица. В первом случае достаточно будет просто передавать речь, и модель будет воссоздавать артикуляцию вне зависимости от объекта. Во втором будет происходить анализирование и отслеживание действий реального объекта и затем передача информации.
Однако в лаборатории подчеркивают, что разработки "Intel" - это разработки будущих технологий, исследования, которые позволяют делать вывод о реальной возможности того или иного научного предположения. "Мы не ведем речь о продукте. Наши исследования опережают нынешние условия на 3-5 лет. Главная наша задача - указать перспективные пути для промышленности, оказать влияние на построение архитектуры компьютеров ", - заметил исполнительный директор INNL Олег Сютин.
В настоящий момент нижегородская лаборатория близка к разрешению двух этапов из трех на пути к виртуальному моделированию - процессам распознавания и анимации. Предстоит третий, называемый исследователями "калибрация" - приведение в соответствие абстрактной модели реальному объекту с целью достижения максимального сходства.
Разработки в этой области параллельно с нижегородской лабораторией ведут такие компании как "MATROX", "Digimask", "Lipsinc" и др. К настоящему моменту они сумели достичь высокой степени в калибрации трехмерной модели и ее текстурировании, но в анимации передачи мимики, артикуляции не ушли дальше "шевеления губ". В нижегородской лаборатории "Intel" сумели сделать обратное: достичь высоких результатов в области анимации, но пока только приступили к стадии калибрации.
"Видите ли, создать динозавров из Юрского периода или говорящих с человеческой артикуляцией животных проще, потому что нет действительного привычного прототипа. Мы не знаем, как могли бы говорить по-человечески животные и моргать динозавры. А с человеком, особенно знакомым, сложнее, потому что здесь мы улавливаем малейшее отклонение", - сказал Валерий Курякин. При этом, он заметил, что появившаяся в цетральных СМИ информация о том, что в Калифорнии будет представлено готовое решение слишком поспешно. Однако, по словам руководителя лаборатории, достичь стадии деформации модели до полного соответствия реальному объекту лаборатория планирует уже через несколько месяцев. Вероятно, что желание опередить конкурентов для сотрудников нижегородской лаборатории не на последнем месте.
Между тем, на вопрос, как они оценивают с точки зрения своих разработок "пророчества" культового писателя Виктора Пелевина в романе
"Generation P" о моделировании на экране телевизоров "президентов" и "березовских", в лаборатории сообщают, что процесс создания виртуальных двойников с последующей возможностью манипулирования в разных целях двойниками политиков и бизнесменов уже теоретически осуществим. "Я понимаю, к чему, к каким избирательным технологиям это может привести, но остановить прогресс никто не может, а люди, желающие его использовать в низких интересах были всегда", - заметил исполнительный директор INNL Олег Сютин.
На фото: абстрактная модель синхронно воспроизводит речь и мимику кокретного человека (его видео в правом верхнем углу монитора). Задача разработчиков - создать возможность деформации модели до сходства с реальным объектом.
Справка НТА: нижегородская компания INNL, занимающаяся разработками в сфере программного обеспечения, создана выходцами ВНИЭФ (г. Саров) 1 мая 2000 года на базе фирмы NSTLab ("NizhegorodSoftWаreLab"). INNL - единственное подразделение "Intel" в России. Исследования осуществляет совместно с ННГУ и МГУ.
У НИА "Нижний Новгород" есть Telegram-канал. Подписывайтесь, чтобы быть в курсе главных событий, эксклюзивных материалов и оперативной информации.
Архив НТА. Copyright © 1999-2006 НТА