Модель работы автофокуса человеческого глаза
#1
Отправлено 14 October 2011 - 01:32
Учёные до сих пор точно не знают, как функционирует автофокус в глазу человека и других животных. Известно, что он работает чрезвычайно быстро и безошибочно. Получая расплывчатую картинку, мозг мгновенно распознаёт дистанцию до объекта и изменяет фокусное расстояние — кривизну хрусталика, чтобы получить чёткое изображение на сетчатке.
Вопрос заключается в том, как именно работает механизм фокусировки в зрительной системе человека? Сейчас биологи приблизились к ответу на этот вопрос. Специалисты из Центра перцепционных систем Техасского университета в Остине (США) разработали самообучающийся статистический алгоритм, который в итоге научился быстро и точно вычислять степень расфокусировки любого фрагмента размытого изображения.
Алгоритм представляет собой компьютерную модель биологической системы человеческого зрения, которую «тренировали» на 400 фрагментах цифровых фотографий природных сцен размером 128х128 пикселов. Для начала были собраны данные, как выглядит частотно-контрастная характеристика, то есть кривая MTF для изображений разной степени расфокусировки (в диоптриях, ΔD). Давно известно, что размытость изображения напрямую влияет на эту характеристику.
После этого на фотографиях прогнали алгоритм, основанный на методе анализа максимизации точности (AMA, accuracy maximization analysis, <a href="http://jburge.cps.utexas.edu/research/Code.html">код AMA для Matlab) с шагом 0,25 диоптрии. Были получены оптимальные фильтры, которые максимально приближают график частотно-контрастной характеристики размытого изображения к идеальному.
Для проверки учёные взяли новый набор данных (ещё 400 изображений), на которых прогнали фильтры. Если применить каждый фильтр на одном и том же объекте, то можно сравнить результаты их работы и понять, какой фильтр подходит лучше всего, то есть какова степень размытости изображения. На графике показаны результаты работы алгоритма по определению степени расфокусировки в диоптриях с вероятностью 68% (толстые вертикальные полоски) и 90% (тонкие полоски).
Чтобы повысить точность работы системы, учёные решили добавить в модель монохроматические аберрации человеческого глаза — принципиально неустранимые погрешности оптических систем. Глаз каждого человека работает не идеально, а с определённой погрешностью по резкости и астигматизму. Эти погрешности (карта аберраций) можно измерить на специальном офтальмологическом оборудовании.
Учёные изменили алгоритм работы фильтров с учётом карты аберраций человеческого глаза и соответствующих частотно-контрастных характеристик. Как ни странно, точность распознавания размытых изображений значительно увеличилась. Выяснилось, что важную роль в определении резкости изображения человеческим глазом играет астигматизм — один из видов аберраций в человеческом глазу, при которой изображение точки, находящейся вне оси, и образуемое узким пучком лучей, представляет собой два отрезка прямой, расположенных перпендикулярно друг другу на разных расстояниях от плоскости безаберрационного фокуса (плоскости Гаусса).
Теперь стало понятно, почему при излечении астигматизма многие пациенты на время теряют способность видеть резкие изображения.
После учёта хроматических аберраций и дифракции в человеческом глазу новые фильтры смогли распознавать размытость изображения с гораздо более высокой точностью.
Опубликованная работа может лечь в основу принципиально новых систем автоматической фокусировки, которые найдут применение в программах обработки изображений для фильтров резкости, а также в цифровых фотоаппаратах и видеокамерах. Здесь они могут заменить многоточечный AF, который работает гораздо менее эффективно — путём многократного замера контрастности нескольких участков изображения.
Optimal defocus estimation in individual natural images. Johannes Burge, Wilson S. Geisler. Proceedings of the National Academy of Sciences, 4 октября 2011 года, vol. 108 no. 40, doi: 10.1073/pnas.1108491108, PDF
http://habrahabr.ru/...cessing/130181/
#9
Отправлено 18 October 2011 - 16:08
Альфред (18 October 2011 - 15:32) писал:
Плюс хочется максимум инфы во время съёмки (гистограммы, области фокусировки и т.д.), т.е. то, что предоставляют ЭВИ, в комбинации с низкой задержкой и достаточно высоким разрешением, разумеется.
Сообщение отредактировал Emacs: 18 October 2011 - 16:09
#10
Отправлено 18 October 2011 - 19:05
К сожалению, полный текст работы недоступен без регистрации.
Может быть, кто-нибудь ее читал полностью? Есть ли там хоть какие-то экспериментальные данные, или только матмодель?
#11
Отправлено 19 October 2011 - 08:30
kps (18 October 2011 - 19:05) писал:
#12
Отправлено 20 October 2011 - 10:30
Bern (14 October 2011 - 01:32) писал:
В частности: Одним глазом точно определить расстояние до объекта удается далеко не всегда.
И в дополениие к этому - алгоритм предполагает два шага.
Первый: по размытому изображению определить расстояние до него.
Второй: фокусировка на уже определенное расстояние.
Не надо много думать, что бы понять, что объем обрабатываемых данных будет гм... большой.
Поставленная автором задача удобно решается применением нейронных сетей. Видимо, автора это ввело в заблуждение.
Реальность представляется несколько проще:
Определив расстояние двумя глазами, мозг на основании опыта фокусирует глаза на уже известное расстояние.
Все вышесказанное - ИМХО.
#13
Отправлено 20 October 2011 - 10:47
ssvSerge (20 October 2011 - 10:30) писал:
...
Определив расстояние двумя глазами, мозг на основании опыта фокусирует глаза на уже известное расстояние.
#16
Отправлено 20 October 2011 - 11:09
r86 (20 October 2011 - 10:52) писал:
почему тогда люди с плохим зрением могут определить расстояние до объекта не получая его четкой картинки?
кстати многие с легкостью определяют расстояние и одним глазом....
#17
Отправлено 20 October 2011 - 11:32
r86 (20 October 2011 - 10:52) писал:
Собственно вопрос не в том "определил - не определил", а в том сколько на это надо времени и попыток, и насколько точно идет определение.
В свое время видел стенд для летчиков/космонавтов. Там человек с одним закрытым глазом должен был научиться бысто и точно дотянутяся до нужного переключателя. Сам не пробовал, но, видимо, было чему учиться.
Но суть не в этом. Работа мне представляется не слишком интересной. Тем более в применении к современной электронике/автофокусе.
Добавил: Чего-то пришло в голову воспоминание:
"Сегодня лаба по физике. Что делать?!!! Вчера была лаба по математике".
Сообщение отредактировал ssvSerge: 20 October 2011 - 11:57
#18
Отправлено 21 October 2011 - 22:17
ssvSerge (20 October 2011 - 10:30) писал:
Реальность представляется несколько проще:
Определив расстояние двумя глазами, мозг на основании опыта фокусирует глаза на уже известное расстояние.
Тогда бы кривые были полуслепы
Что, как известно, не так
peter_koen (20 October 2011 - 11:09) писал:
Поступающая главным образом через органы зрения
#19
Отправлено 21 October 2011 - 22:50
Но таки одним глазом точность оценки расстояния заведомо ниже. Точные данные - не помню, к сожалению, за давностию лет.
Жаль, что никто не видел, что там внутри, в этой работе.
Без экспериментальных данных (причем еще большой вопрос, насколько корректен был эксперимент, если был, так что нужно еще методику смотреть) это все фантазии беспочвенные, из серии "физики шутят"... то бишь "математики развлекаются".
Я не утвержаю, что их там нет, этих данных, я всего лишь интересуюсь, можно ли к этой работе относиться серьезно. Но "на почитать" ее просто так не дают, увы...
#20
Отправлено 22 October 2011 - 15:07
Bern (21 October 2011 - 22:17) писал:
А глаз - короткофокусная линза. Со страшной бочковидной дисторсией (частично компенсируемой вогнутой матрицей), гиперфокалом от нескольких метров и далее, со скромным разрешением, дающая, к тому же, перевёрнутое изображение. А за то, что видим мы вовсе не то, что здесь описано - спасибо мозгу.
И, кстати, в определении расстояния до предмета участвуют осязание и обоняние.
#21
Отправлено 22 October 2011 - 17:17
peter_koen (22 October 2011 - 15:07) писал:
А глаз - короткофокусная линза. Со страшной бочковидной дисторсией (частично компенсируемой вогнутой матрицей), гиперфокалом от нескольких метров и далее, со скромным разрешением, дающая, к тому же, перевёрнутое изображение.
И всё последующее-результат обработки изображения, созданного этой линзой.
peter_koen (22 October 2011 - 15:07) писал:
Вы замечаете ухудшение зрения, если не можете дотронуться до предмета, а нос заложен ? )
Сообщение отредактировал Bern: 22 October 2011 - 17:17
#24
Отправлено 22 October 2011 - 21:29
Bern (22 October 2011 - 17:17) писал:
Bern (22 October 2011 - 17:17) писал:
Вот, например, при не белом (!) освещении увидев дольку лимона и почувствовав запах лимона вы увидите эту дольку жёлтого цвета. Независимо от её реального цвета (окрашенности).
#25
Отправлено 22 October 2011 - 21:35
Bern (22 October 2011 - 20:19) писал:
Распознавание цвета соответствующими колбочками, по моему, только теория. Хотя и самая распространённая. Фокусировка глаза, что доказано, осуществляется изменением кривизны хрусталика. Механизм изменения его кривизны тоже понятен. А вот что запускает этот механизм?
#26
Отправлено 23 October 2011 - 22:22
peter_koen (22 October 2011 - 21:35) писал:
Т.е. мозг каждого человека решает задачу индивидуально и с индивидуальными особенностями.
Сходство результатов - не более чем результат сходности задач (расстояние, распознавание объектов).
Более того - это касается не только обработки зрительной информации.
Различные эксперименты говорят о различном времени адаптации.
Не следствие ли это разных правил обработки данных?
Сообщение отредактировал ssvSerge: 23 October 2011 - 22:23
#27
Отправлено 23 October 2011 - 22:42
kps (21 October 2011 - 22:50) писал:
Без экспериментальных данных ... это все фантазии беспочвенные ...
Но, скорее всего, разработали алгоритм, который сходиться быстрее (возможно радикально быстрее), чем все известные.
В принципе, быстрая сходимость может позволить и автофокус сделать. Но, я думаю, не на носимой камере.
Возможно в оптическом прицеле. Там распознавать надо строго один образ.
Количество пользователей, читающих эту тему: 1
0 пользователей, 1 гостей, 0 анонимных