Отключен JavaScript

У вас отключен JavaScript. Некоторые возможности системы не будут работать. Пожалуйста, включите JavaScript для получения доступа ко всем функциям.

3

Модель работы автофокуса человеческого глаза

Автор Bern, 14 Oct 2011 01:32

Перейти к первому непрочитанному сообщению

Сообщений в теме: 26

#1 Bern

Пользователь
6380 сообщений

Город:Питер

Отправлено 14 October 2011 - 01:32

Математическая модель работы автофокуса в глазу человека

Учёные до сих пор точно не знают, как функционирует автофокус в глазу человека и других животных. Известно, что он работает чрезвычайно быстро и безошибочно. Получая расплывчатую картинку, мозг мгновенно распознаёт дистанцию до объекта и изменяет фокусное расстояние — кривизну хрусталика, чтобы получить чёткое изображение на сетчатке.

Вопрос заключается в том, как именно работает механизм фокусировки в зрительной системе человека? Сейчас биологи приблизились к ответу на этот вопрос. Специалисты из Центра перцепционных систем Техасского университета в Остине (США) разработали самообучающийся статистический алгоритм, который в итоге научился быстро и точно вычислять степень расфокусировки любого фрагмента размытого изображения.

Алгоритм представляет собой компьютерную модель биологической системы человеческого зрения, которую «тренировали» на 400 фрагментах цифровых фотографий природных сцен размером 128х128 пикселов. Для начала были собраны данные, как выглядит частотно-контрастная характеристика, то есть кривая MTF для изображений разной степени расфокусировки (в диоптриях, ΔD). Давно известно, что размытость изображения напрямую влияет на эту характеристику.

После этого на фотографиях прогнали алгоритм, основанный на методе анализа максимизации точности (AMA, accuracy maximization analysis, <a href="http://jburge.cps.utexas.edu/research/Code.html">код AMA для Matlab) с шагом 0,25 диоптрии. Были получены оптимальные фильтры, которые максимально приближают график частотно-контрастной характеристики размытого изображения к идеальному.

Для проверки учёные взяли новый набор данных (ещё 400 изображений), на которых прогнали фильтры. Если применить каждый фильтр на одном и том же объекте, то можно сравнить результаты их работы и понять, какой фильтр подходит лучше всего, то есть какова степень размытости изображения. На графике показаны результаты работы алгоритма по определению степени расфокусировки в диоптриях с вероятностью 68% (толстые вертикальные полоски) и 90% (тонкие полоски).

Чтобы повысить точность работы системы, учёные решили добавить в модель монохроматические аберрации человеческого глаза — принципиально неустранимые погрешности оптических систем. Глаз каждого человека работает не идеально, а с определённой погрешностью по резкости и астигматизму. Эти погрешности (карта аберраций) можно измерить на специальном офтальмологическом оборудовании.

Учёные изменили алгоритм работы фильтров с учётом карты аберраций человеческого глаза и соответствующих частотно-контрастных характеристик. Как ни странно, точность распознавания размытых изображений значительно увеличилась. Выяснилось, что важную роль в определении резкости изображения человеческим глазом играет астигматизм — один из видов аберраций в человеческом глазу, при которой изображение точки, находящейся вне оси, и образуемое узким пучком лучей, представляет собой два отрезка прямой, расположенных перпендикулярно друг другу на разных расстояниях от плоскости безаберрационного фокуса (плоскости Гаусса).

Теперь стало понятно, почему при излечении астигматизма многие пациенты на время теряют способность видеть резкие изображения.

После учёта хроматических аберраций и дифракции в человеческом глазу новые фильтры смогли распознавать размытость изображения с гораздо более высокой точностью.

Опубликованная работа может лечь в основу принципиально новых систем автоматической фокусировки, которые найдут применение в программах обработки изображений для фильтров резкости, а также в цифровых фотоаппаратах и видеокамерах. Здесь они могут заменить многоточечный AF, который работает гораздо менее эффективно — путём многократного замера контрастности нескольких участков изображения.

Optimal defocus estimation in individual natural images. Johannes Burge, Wilson S. Geisler. Proceedings of the National Academy of Sciences, 4 октября 2011 года, vol. 108 no. 40, doi: 10.1073/pnas.1108491108, PDF

http://habrahabr.ru/...cessing/130181/

#2 vitzap

Пользователь
2627 сообщений

Город:г. Челябинск

Отправлено 14 October 2011 - 05:24

Чрезвычайно полезное исследование.
...и опять начнется новая волна заявлений о "смерти зеркалок"

#3 Bern

Пользователь
6380 сообщений

Город:Питер

Отправлено 14 October 2011 - 11:05

vitzap (14 October 2011 - 05:24) писал:

...и опять начнется новая волна заявлений о "смерти зеркалок"

Не о новом алгоритме АФ ?

#4 ArksonisIntro

Бригада мучеников сафокса

Пользователь
9331 сообщений

Имя:Александр
Отчество:Михайлович
Фамилия:Сергунин
Город:Москва

Отправлено 14 October 2011 - 11:12

Очень интересно! Спасибо за создание темы с данной статьёй!

#5 Bern

Пользователь
6380 сообщений

Город:Питер

Отправлено 14 October 2011 - 13:01

Александр-Arksonis (14 October 2011 - 11:12) писал:

Очень интересно! Спасибо за создание темы с данной статьёй!

Да про сам механизм, собственно, нет...

#6 A. 'TailEx' Deryushkin

Пользователь
776 сообщений

Город:Россия, Москва

Отправлено 18 October 2011 - 13:07

Спасибо, было интересно почитать.

#7 Emacs

Пользователь
2727 сообщений

Город:Москва

Отправлено 18 October 2011 - 15:30

Ну что, смерть зеркалок? Отличная новость!

#8 Альфред

Тщетно бытие

Пользователь
13587 сообщений

Город:Нижнее днище нижнего ада

Отправлено 18 October 2011 - 15:32

У тебя прямо личные счёты с зеркалками, я смотрю

#9 Emacs

Пользователь
2727 сообщений

Город:Москва

Отправлено 18 October 2011 - 16:08

Альфред (18 October 2011 - 15:32) писал:

У тебя прямо личные счёты с зеркалками, я смотрю

Они слишком большие и тяжёлые )
Плюс хочется максимум инфы во время съёмки (гистограммы, области фокусировки и т.д.), т.е. то, что предоставляют ЭВИ, в комбинации с низкой задержкой и достаточно высоким разрешением, разумеется.

Сообщение отредактировал Emacs: 18 October 2011 - 16:09

#10 kps

Пользователь
556 сообщений

Город:Москва

Отправлено 18 October 2011 - 19:05

Как всякая математическая модель, к реальной работе зрения (то есть системы глаза-мозг) может иметь весьма отдаленное отношение, а может и не иметь вообще никакого.
К сожалению, полный текст работы недоступен без регистрации.
Может быть, кто-нибудь ее читал полностью? Есть ли там хоть какие-то экспериментальные данные, или только матмодель?

#11 peter_koen

Пользователь
2437 сообщений

Город:Калининград (Koenigsberg)

Отправлено 19 October 2011 - 08:30

kps (18 October 2011 - 19:05) писал:

Как всякая математическая модель, к реальной работе зрения (то есть системы глаза-мозг) может иметь весьма отдаленное отношение, а может и не иметь вообще никакого.

Вероятно, что никакого и не имеет. Глаз - дерьмовая оптика (что у человека компенсируется потрясающим процессором обработки изображения).

#12 ssvSerge

Пользователь
448 сообщений

Имя:Сергей
Город:Crimea, Prague

Отправлено 20 October 2011 - 10:30

Bern (14 October 2011 - 01:32) писал:

как функционирует автофокус в глазу человека ... Получая расплывчатую картинку, мозг мгновенно распознаёт дистанцию до объекта и изменяет фокусное расстояние.

Есть ощущение, что в основу работы положены ложные предпосылки.
В частности: Одним глазом точно определить расстояние до объекта удается далеко не всегда.
И в дополениие к этому - алгоритм предполагает два шага.
Первый: по размытому изображению определить расстояние до него.
Второй: фокусировка на уже определенное расстояние.

Не надо много думать, что бы понять, что объем обрабатываемых данных будет гм... большой.

Поставленная автором задача удобно решается применением нейронных сетей. Видимо, автора это ввело в заблуждение.
Реальность представляется несколько проще:
Определив расстояние двумя глазами, мозг на основании опыта фокусирует глаза на уже известное расстояние.

Все вышесказанное - ИМХО.

#13 peter_koen

Пользователь
2437 сообщений

Город:Калининград (Koenigsberg)

Отправлено 20 October 2011 - 10:47

ssvSerge (20 October 2011 - 10:30) писал:

Есть ощущение, что в основу работы положены ложные предпосылки.
...
Определив расстояние двумя глазами, мозг на основании опыта фокусирует глаза на уже известное расстояние.

И то, что дальше 4-5 м для глаза - гиперфокал. Так что фокусировка в глазу идёт не постоянно (и не быстро, можно проверить на простом опыте).

#14 r86

Пользователь
99 сообщений

Город:Смоленск

Отправлено 20 October 2011 - 10:52

в реальности не все так просто.
почему тогда люди с плохим зрением могут определить расстояние до объекта не получая его четкой картинки?
кстати многие с легкостью определяют расстояние и одним глазом....

#15 Альфред

Тщетно бытие

Пользователь
13587 сообщений

Город:Нижнее днище нижнего ада

Отправлено 20 October 2011 - 11:04

Не то, чтобы с лёгкостью, но на основе опыта, известности некоторых масштабов - прикнуть вполне можно. Но и обмануться, также...

#16 peter_koen

Пользователь
2437 сообщений

Город:Калининград (Koenigsberg)

Отправлено 20 October 2011 - 11:09

r86 (20 October 2011 - 10:52) писал:

в реальности не все так просто.
почему тогда люди с плохим зрением могут определить расстояние до объекта не получая его четкой картинки?
кстати многие с легкостью определяют расстояние и одним глазом....

Человек и видит, и определяет расстояния вовсе не глазом. Мозгом. В котором есть для этого вся необходимая информация.

#17 ssvSerge

Пользователь
448 сообщений

Имя:Сергей
Город:Crimea, Prague

Отправлено 20 October 2011 - 11:32

r86 (20 October 2011 - 10:52) писал:

кстати многие с легкостью определяют расстояние и одним глазом....

Да. Определяют. Но после долгих и упорных тренировок.
Собственно вопрос не в том "определил - не определил", а в том сколько на это надо времени и попыток, и насколько точно идет определение.
В свое время видел стенд для летчиков/космонавтов. Там человек с одним закрытым глазом должен был научиться бысто и точно дотянутяся до нужного переключателя. Сам не пробовал, но, видимо, было чему учиться.

Но суть не в этом. Работа мне представляется не слишком интересной. Тем более в применении к современной электронике/автофокусе.

Добавил: Чего-то пришло в голову воспоминание:
"Сегодня лаба по физике. Что делать?!!! Вчера была лаба по математике".

Сообщение отредактировал ssvSerge: 20 October 2011 - 11:57

#18 Bern

Пользователь
6380 сообщений

Город:Питер

Отправлено 21 October 2011 - 22:17

ssvSerge (20 October 2011 - 10:30) писал:

Реальность представляется несколько проще:
Определив расстояние двумя глазами, мозг на основании опыта фокусирует глаза на уже известное расстояние.

Тогда бы кривые были полуслепы

Что, как известно, не так

peter_koen (20 October 2011 - 11:09) писал:

Человек и видит, и определяет расстояния вовсе не глазом. Мозгом. В котором есть для этого вся необходимая информация.

Поступающая главным образом через органы зрения

#19 kps

Пользователь
556 сообщений

Город:Москва

Отправлено 21 October 2011 - 22:50

А у мозга могут быть разные алгоритмы обработки входной информации, и компенсационные механизмы имеются. При этом он способен адаптироваться к изменениям входного сигнала, но это требует времени. И мозг обрабатывает данные, поступающие по всем каналам восприятия, а не только через глаза. Плюс к тому еще и с учетом накопленного опыта.

Но таки одним глазом точность оценки расстояния заведомо ниже. Точные данные - не помню, к сожалению, за давностию лет.

Жаль, что никто не видел, что там внутри, в этой работе.
Без экспериментальных данных (причем еще большой вопрос, насколько корректен был эксперимент, если был, так что нужно еще методику смотреть) это все фантазии беспочвенные, из серии "физики шутят"... то бишь "математики развлекаются".

Я не утвержаю, что их там нет, этих данных, я всего лишь интересуюсь, можно ли к этой работе относиться серьезно. Но "на почитать" ее просто так не дают, увы...

#20 peter_koen

Пользователь
2437 сообщений

Город:Калининград (Koenigsberg)

Отправлено 22 October 2011 - 15:07

Bern (21 October 2011 - 22:17) писал:

Поступающая главным образом через органы зрения

...глаз (глазное яблоко) которых является лишь частью. Дальше - зрительный нерв, нейроны зрительного пути и далее - до коркового зрительного центра.
А глаз - короткофокусная линза. Со страшной бочковидной дисторсией (частично компенсируемой вогнутой матрицей), гиперфокалом от нескольких метров и далее, со скромным разрешением, дающая, к тому же, перевёрнутое изображение. А за то, что видим мы вовсе не то, что здесь описано - спасибо мозгу.
И, кстати, в определении расстояния до предмета участвуют осязание и обоняние.

#21 Bern

Пользователь
6380 сообщений

Город:Питер

Отправлено 22 October 2011 - 17:17

peter_koen (22 October 2011 - 15:07) писал:

.
А глаз - короткофокусная линза. Со страшной бочковидной дисторсией (частично компенсируемой вогнутой матрицей), гиперфокалом от нескольких метров и далее, со скромным разрешением, дающая, к тому же, перевёрнутое изображение.

И всё последующее-результат обработки изображения, созданного этой линзой.

peter_koen (22 October 2011 - 15:07) писал:

в определении расстояния до предмета участвуют осязание и обоняние.

Вы замечаете ухудшение зрения, если не можете дотронуться до предмета, а нос заложен ?

)

Сообщение отредактировал Bern: 22 October 2011 - 17:17

#22 Epigon

Пользователь
13504 сообщений

Город:Новосибирск Академ

Отправлено 22 October 2011 - 18:47

кстати из всего этого следут что существует всё же некая схема обработки дрянного изображения создающая из него конфетку..
значит осталось ее только понять и реализовать.. а потом снимать можно будет хоть на мобильник

#23 Bern

Пользователь
6380 сообщений

Город:Питер

Отправлено 22 October 2011 - 20:19

Штука в динамике.Глаз, насколько понимаю, не на точку фокусируется, а пробегает целый сектор-вот из всех этих значений мозг и составляет картинку.
Но тут иной вопрос-каков алгоритм фокусировки глаза в каждой точке ?

#24 peter_koen

Пользователь
2437 сообщений

Город:Калининград (Koenigsberg)

Отправлено 22 October 2011 - 21:29

Bern (22 October 2011 - 17:17) писал:

И всё последующее-результат обработки изображения, созданного этой линзой.

Ну, в том числе. А ещё результат базы данных образов, создающейся с рождения и хранящейся в мозгу.

Bern (22 October 2011 - 17:17) писал:

Вы замечаете ухудшение зрения, если не можете дотронуться до предмета, а нос заложен ?

)

Не так прямолинейно!
Вот, например, при не белом (!) освещении увидев дольку лимона и почувствовав запах лимона вы увидите эту дольку жёлтого цвета. Независимо от её реального цвета (окрашенности).

#25 peter_koen

Пользователь
2437 сообщений

Город:Калининград (Koenigsberg)

Отправлено 22 October 2011 - 21:35

Bern (22 October 2011 - 20:19) писал:

Штука в динамике.Глаз, насколько понимаю, не на точку фокусируется, а пробегает целый сектор-вот из всех этих значений мозг и составляет картинку. Но тут иной вопрос-каков алгоритм фокусировки глаза в каждой точке ?

Да кто ж это знает?
Распознавание цвета соответствующими колбочками, по моему, только теория. Хотя и самая распространённая. Фокусировка глаза, что доказано, осуществляется изменением кривизны хрусталика. Механизм изменения его кривизны тоже понятен. А вот что запускает этот механизм?

#26 ssvSerge

Пользователь
448 сообщений

Имя:Сергей
Город:Crimea, Prague

Отправлено 23 October 2011 - 22:22

peter_koen (22 October 2011 - 21:35) писал:

Да кто ж это знает?

Существует мнение, что единого алгоритма не существует.
Т.е. мозг каждого человека решает задачу индивидуально и с индивидуальными особенностями.
Сходство результатов - не более чем результат сходности задач (расстояние, распознавание объектов).
Более того - это касается не только обработки зрительной информации.

Различные эксперименты говорят о различном времени адаптации.
Не следствие ли это разных правил обработки данных?

Сообщение отредактировал ssvSerge: 23 October 2011 - 22:23

#27 ssvSerge

Пользователь
448 сообщений

Имя:Сергей
Город:Crimea, Prague

Отправлено 23 October 2011 - 22:42

kps (21 October 2011 - 22:50) писал:

Жаль, что никто не видел, что там внутри, в этой работе.
Без экспериментальных данных ... это все фантазии беспочвенные ...

Да. Было бы интересно.
Но, скорее всего, разработали алгоритм, который сходиться быстрее (возможно радикально быстрее), чем все известные.
В принципе, быстрая сходимость может позволить и автофокус сделать. Но, я думаю, не на носимой камере.
Возможно в оптическом прицеле. Там распознавать надо строго один образ.

Обратно в Просто обо всем · Следующая непрочитанная тема →

Количество пользователей, читающих эту тему: 1

0 пользователей, 1 гостей, 0 анонимных