|
تقنية
تسمح
بالرؤية المجسمة
على
الشبكة
بقلم جو تويست
Eng/Arb
تحاكي التكنولوجيا
الجديدة طريقة ترجمة المخ للصور
قد يصبح استخدام برامج
المحادثة والرسائل اكثر إثارة اذا بدأ استخدام تكنولوجيا جديدة لكاميرا تعمل
على الانترنت تطورها مايكروسوفت.
والتكنولوجيا الجديدة،
التي يطلق عليها "اي تو اي" i2i webcam
وتطورها مايكروسوفت في مختبراتها للابحاث في كامبردج في بريطانيا، هي نظام
يتكون من آلتي تصوير تتبعان حركة الشخص.
ويستخدم هذا النظام
معادلات حسابية مصممة خصيصا لتحويل ما تراه كل كاميرا الى صورة اقرب الى الواقع
او صورة ثلاثية الابعاد.
ويقول انطونيو كريمنيسي
الذي يقود بحث مايكروسوفت "نجحنا في التوصل لمعادلة حسابية يمكن من خلالها
التقاط صورتين وتحويلهما الى صورة واحدة ثلاثية الابعاد".
واضاف "بوسعنا الان
الحصول على صورة تبدو كما لو كان الشخص ينظر اليك بعينيه باستخدام هذه
التكنولوجيا القوية".
محاكاة المخ
وتقول مايكروسوفت ان
بحثا حديثا اظهر ان اكثر من 18.5 مليون شخص يستخدمون كاميرات في الاتصال عبر
الانترنت خلال استخدامهم لبرامج المحادثة والرسائل.
ومن بين المستخدمين
مراهقون يتحدثون عن واجباتهم المدرسية وموظفون في شركات.
لكن المشكلة كانت دائما
هي ان المستخدمين يظهر انهم ينظرون الى الفراغ وليس إلى الشخص الذي يتحدثون
إليه.
هذا النوع من الابحاث
مستمر منذ سنوات لكن لم يتم التوصل إلى نتيجة بهذه الدقة من قبل
د. كريمنيسي قائد فريق
البحث
ورغم ان الامر يبدو بشكل
اكبر من اجل المتعة الا ان الدكتور كريمنيسي يؤكد ان بحثه يسعى في الاساس الى
حل "قضايا علمية اكبر".
ويعتبر أكبر تحدي يواجه
الباحثين هو معرفة آلية عمل المخ لتمييز الالوان وتحديد المسافات والابعاد
والاشكال ثم تصميم نماذج لما يمكن ان تراه العين.
وقال كريمنيسي ان ما
فعله الباحثون تبسيطا هو استبدال العين البشرية بآلتي تصوير، والمخ بجهاز
كمبيوتر.
وتجعل الصورة المجسمة
التي يحصل عليها الباحثون باستخدام هذه التكنولوجيا عملية اعادة تكوين صورة
ثلاثية الابعاد في نفس الوقت وبشكل دقيق عن طريق جهاز كمبيوتر امرا ممكنا.
وهذه التكنولوجيا من
نفس نوع التكنولوجيا التي استخدمت لاعادة تكوين صور ثلاثية الابعاد لسطح كوكب
المريخ بعد ارسالها من مسبار للكوكب.
ويمكن لنظام "اي تو اي"
ايضا تصميم صور تبدو واقعية للخلفية حتى يمكن للمستخدمين التظاهر انهم في مكان
اخر غير الموجودين فيه.
قلب نابض يطير من حولك!
ويضيف كريمنيسي "هذا امر
مهم بالنسبة للخصوصية لأن المستخدم ربما لا يريد ان ترى الفوضى الموجودة في
غرفة نومه".
ومن الخصائص الجديدة
التي ستجتذب الشباب قدرة هذا النظام على وضع صور واشكال ثلاثية الابعاد للتعبير
عن السعادة او الحزن على سبيل المثال بدلا من كتابة حروف او الوجوه التقليدية
البسيطة للتعبير عن ذلك.
ربما يظن الآخرون أنك
زرت هذا المكان الخلاب
فمثلا سيمكنك مشاهدة
الذي تتحدث إليه وإلى جانبه قلب ينبض على الشاشة ويطير حوله، أو مصابح يضيء
للتعبير عن فكرة!
وتعتبر قدرة الكاميرا
على التمييز بين مقدمة وخلفية الصور أمرا مهما لتحويلها الى صور ثلاثية
الابعاد.
ويرى الدكتور كريمنيسي
ان هذا النظام مفيد للغاية وممتع في نفس الوقت لان قدرته على التعقب وامكانياته
الذكية يمكن ان تعزز تجارب عقد اجتماعات الأعمال عن طريق الإنترنت ووصلات
الفيديو.
وقال "هذا النوع من
الابحاث مستمر في مجال الاجهزة الخاصة بالتصوير والرؤية منذ سنوات لكن لم يتم
التوصل إلى نتيجة بهذه الدقة من قبل. هذا النظام مهم بالنسبة للاجتماعات التي
تتم عن طريق وصلات الفيديو لانه يستطيع تحديد ما هو مهم في المكان بشكل مباشر
وتسليط البؤرة عليه".
ومازالت هناك بعض الامور
تحتاج الى حل قبل ان تدخل التقنية طور الانتاج لكن كريمنيسي يقول ان الباحثين
حققوا الكثير في اقل من عامين.
ويضيف الباحث "هناك
اشياء كثيرة خارج سيطرتنا. لكننا نتحدث عن الحد الذي يمكننا من خلاله تحقيق
ذلك".
ومع ذلك لا تزال هذه
التكنولوجيا في مهدها، ولكن سرعان ما ستتلقفها برامج الرسائل الإلكترونية مثل
مايكروسوفت إم إس إن وياهوو ماسنجر وأمريكا أونلاين ايم.
Webcam lets users eyeball others
By Jo Twist
The cameras are based on how the
brain processes images
Instant messaging could get a lot more interesting if webcam
technology from Microsoft gets the go-ahead.
i2i, in development at Microsoft's research lab in
Cambridge, UK, is a two-camera system which very carefully follows an
individual's movement.
It uses a specially developed algorithm to fuse what each
camera sees to create an accurate stereo "cyclopean" image.
This means it looks as if users are looking each other in
the eye. It can also display floating 3D emoticons.
"We were able to come up with an
algorithm that was able to take two images and capture a corresponding map
in 3D," said Antonio Criminisi, lead researcher of Microsoft's Machine
Learning and Perception Group.
"Using this powerful technology,
we can now synthetically create an image as if the person is looking at you."
Brain cam
Recent research has revealed that more than 18.5 million
people are using webcams while they use instant messaging (IM), according to
Microsoft.
Users range from teenagers talking about homework to groups
in a corporate environment.
But the problem has always been that users appear to be
looking at something other than the person they are chatting with.
This kind of research has been
going on in the machine vision community for a number of years, but this
kind of result has not been produced with accuracy before
Dr Criminisi, Microsoft Research Cambridge
Even though it all sounds like a lot of fun, Dr Criminisi
insists his group is primarily about solving "bigger scientific issues".
The biggest challenge for the researchers was working out
how the visual brain works; how it sorts out colours, distances and shapes,
and then creates models of what the eye sees.
Essentially, what the researchers have done, according to Dr
Criminisi, is replace the human eyes with cameras, and the brain with a
computer.
The stereo algorithm created by the researchers, which lies
behind the technology, makes it possible to reconstruct 3D geometry in
real-time and accurately on a standard computer.
It is the same kind of technology used to recreate 3D images
of the surface of Mars which were sent back from the US space agency rovers.
The i2i system can also generate realistic background images
so that users can pretend they are somewhere else.
"This is important for privacy,
because I might not want you to see how messy my bedroom is," he said.
Another innovative feature which is sure to grab the teenage
market is the "smarticons" created for the system.
Instead of typing emoticons - pictorial expressions like
happy or sad faces - i2i can superimpose floating, 3D ones.
A user can have a beating heart float around their head, for
instance, or an idea light bulb.
The ability for a camera to be able to discriminate
foreground and background images is key when it comes to the way the cameras
recreate 3D geometry.
Smarty pants
But it is in the corporate context which Dr Criminisi sees
the i2i being extremely useful, as well as entertaining.
Its tracking ability, called smart framing, and its smart
focusing capability, could enhance the video conferencing experience.
You can pretend you went on that amazing holiday
"This kind of research has been
going on in the machine vision community for a number of years, but this
kind of result has not been produced with such accuracy before," said Dr
Criminisi.
"It is important for video
conferencing applications because the system can automatically detect what
is important in the scene," he added.
There are still some issues to be ironed out - such as
processing power - before it is taken to the product development group at
Microsoft, but, said Dr Criminisi, a great deal had been achieved in under
two years.
"Many things are out of our
control," he said, "but we are talking about to what extent we can make this
happen."
Right now, the technology is just in its infant stages.
The group is already exploring the potential for users to
create their own wrap-around avatar-like 3D faces, or masks, which can move
with them and appear real.
This kind of application could prove a massive hit with the
gaming community.
With Microsoft's MSN IM program as well as Yahoo Messenger
and AOL Aim currently dominating messaging applications on the web, this
kind of technology may not be too far off.
|