Коллектив Авторов - Цифровой журнал «Компьютерра» № 85
- Название:Цифровой журнал «Компьютерра» № 85
- Автор:
- Жанр:
- Издательство:неизвестно
- Год:неизвестен
- ISBN:нет данных
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Коллектив Авторов - Цифровой журнал «Компьютерра» № 85 краткое содержание
DigiNotar и SSL-сертификаты: ограбление по-ирански Автор: Юрий Ильин
ИнтервьюВадим Хлопонин о рисовании лазером Автор: Андрей Письменный
ТерралабПервый взгляд на планшеты Asus Eee Автор: Андрей Письменный
КолумнистыКафедра Ваннаха: Гонка за лидером Автор: Ваннах Михаил
Кивино гнездо: 9/11 — десять лет спустя Автор: Киви Берд
Василий Щепетнёв: Лояльность Автор: Василий Щепетнев
Дмитрий Шабанов: Нищета солипсизма Автор: Дмитрий Шабанов
Кафедра Ваннаха: Цена Медичейских звёзд Автор: Ваннах Михаил
Александр Амзин: Ничего не изменилось Автор: Александр Амзин
Василий Щепетнёв: Недопрогрессивность Автор: Василий Щепетнев
Кафедра Ваннаха: Писатель без бумаги Автор: Ваннах Михаил
Дмитрий Вибе: Угол обзора Автор: Дмитрий Вибе
Голубятня-ОнлайнГолубятня: FineReader 11.0 Автор: Сергей Голубицкий
Голубятня: Ящик из бука для book'a Автор: Сергей Голубицкий
Цифровой журнал «Компьютерра» № 85 - читать онлайн бесплатно полную версию (весь текст целиком)
Интервал:
Закладка:
Телескоп Pan-STARRS1 (Фото Роба Ратковски, PS1SC)
Но это, так сказать, цветочки. Ягодки — телескоп LSST(Large Synoptic Survey Telescope), который установят в Чили, чтобы «обслуживать» Южное полушарие. Это будет телескоп с гигантским зеркалом (8,4 метра) и столь же гигантской матрицей (3,2 гигапиксела) при поле зрения поперечником 3,5°. Его главной задачей будет десятилетний мониторинг половины неба, на протяжении которого каждый участочек площадью в 10 квадратных градусов сфотографируют около тысячи раз. Тут уж даже слабым транзиентам не удастся избежать обнаружения, внесения в списки и детального изучения (при помощи «обычных» телескопов).
Казалось бы, мечты о постоянном мониторинге неба наконец сбываются. Но их осуществление, как водится, рождает новые проблемы. Главной трудностью оказывается вдруг не получение информации, а её обработка. Ещё лет десять-пятнадцать назад типичный звёздный или ещё какой-нибудь каталог можно было скачать на свой компьютер в виде ASCII-файла и работать с ним любым привычным способом — хоть написав программу для анализа текста на Фортране. С данными SDSS ситуация уже принципиально иная: для доступа к каталогу необходимо написать SQL-запрос и работать уже не с полным каталогом, а с выборкой. Я, честно говоря, даже не знаю, допустимо ли обратиться к базе данных с запросом типа «select *», но даже если это и допустимо, то вряд ли практично: объём данных измеряется десятками терабайт. Так выяснилось, что для успешной работы с новыми данными теперь мало знать теоретическую астрофизику и Фортран, а нужно ещё учить SQL.
И дальше всё будет только хуже. Терабайты SDSS покажутся трёхдюймовой дискетой по сравнению с итогами работы LSST, окончательный объём данных которого, как ожидается, составит сотню петабайт. К этой информации уж точно будет не подступиться без специальной подготовки. А ведь LSST будет лишь провозвестником новой эры: имеются планы создания подобных же инструментов в других диапазонах, например радио. Вполне возможно, что в середине века петабайт станет не рекордной, а рутинной мерой для астрономической информации (не только наблюдательной, но и теоретической).
В общем, работа наблюдателя заметно эволюционирует. Первые наблюдатели сами выбирали объекты для наблюдений и сами наблюдали их. Теперь всё чаще наблюдатель лишь выбирает объект, а наблюдения для него проводит та или иная обсерватория. Следующий шаг — обсерватория пронаблюдает вообще всё, а наблюдателю останется лишь найти в сотнях петабайт нужную информацию. В результате работа астронома-наблюдателя станет окончательно не похожей на занятие, начало которому положил Галилей. Впрочем, и для успешной работы с каталогами найдётся достойный исторический прототип: именно кропотливый анализ чужих наблюдательных данных привёл Кеплера к открытию законов планетных движений.
К оглавлению
Голубятня-Онлайн
Голубятня: FineReader 11.0
Сергей Голубицкий
Опубликовано05 сентября 2011 года
Вышла новая — одиннадцатая — версия Файнридера, о котором впервые я написал в Голубятне под номером 35 — «Acid Test: FineReader 5.0» — РОВНО 11 лет назад — 5 сентября 2000 года!
Удивительное совпадение, не правда ли? А с другой стороны — вот так вот и проходит наша жизнь: от релиза Файнридера к релизу ☺
Поскольку древнюю ту Голубятню сегодня днем с огнем не сыскать даже в архивах на сайте Компьютерры (так долго архивы не живут), а главное — результаты того «кислотного теста» я задумал сопоставить с новейшим релизом 11, приведу текст раритетного текста целиком, тем более, что поначалу Голубятни были крохотные:
ACID TEST (FineReader 5.0)
По коридорам редакции в перерывах между путешествиями бродит увешенная бесчисленными технопобрякушками (Palm Pilot, Nokia 7110, Twincept и т.п.) личность — говорят, это главный редактор журнала Козловский. Именно он, прочитав предыдущую «Голубятню», заявил, что я всех достал своими эмоциями: мол, взахлеб советую программы и при этом не подкрепляю чувства доказательствами. Это — старческий поклеп, и сегодня я готов доказать свою правоту.
На свет появился FineReader пятой версии. Появился как истинный диверсант, оставив в полном неведении всезнающих жуков на Горбушке. Финальный релиз Windows Millennium, который поступит в продажу только в конце сентября, лежал на прилавках уже в июне. Ровно неделю назад я поинтересовался о наличии FineReader 5.0, и на меня посмотрели как на ламернутого дурачка: «Мальчик, такого нет в природе!»
Нет, дядька, он в природе есть! Детали презентации программы и красочную коробку пятого «Файнридера», выдающую дизайн мирового класса, уже описал Денис Викторов в «ИнфоБизнесе». Козловский ничего написать не успел, потому что опять куда-то отчалил. Я же подверг новый релиз «аббийного» (от ABBYY — создателя программы) флагмана настоящему кислотному тесту, чем и готов поделиться.
Программы OCR [1] — веселые программы. Всякий апгрейд сопровождается невиданным хайпом: из победоносного релиза мы узнаем, что задействованы революционные технологии, полностью переписан код, радикально изменено ядро распознавания, скорость распознавания увеличилась в N-ное число раз. Это уже было и раньше в случае с четвертой версией FineReader, то же самое я слышал в связи с CuneiForm 2000. Про пятую версию FineReader тоже сказано, что «точность распознавания улучшена в 1,5–2 раза по сравнению с версией 4.0».
Насколько это так, мы сейчас посмотрим. Почему речь зашла о ? Дело в том, что совершенно бесполезно тестировать современные программы распознавания знаков на свеженьких текстах, отпечатанных типографским способом либо на лазерном принтере. Результат будет заведомо безупречен. Поэтому, если вам приходится иметь дело только с такими документами, то создавать электронный архив можно с любой программой OCR — разницы вы не почувствуете. Другое дело — документы экстремального характера… кислотном тесте (acid test[2] )
14 лет назад из-под тонких пальчиков профессиональной машинистки выскочили 219 страничек моей диссертации. Как водится, первый экземпляр перекочевал к научному руководителю, второй — на кафедру, третий — в Ленинскую библиотеку в архивный отдел, а вот четвертый я зажал на память. Все эти годы я периодически возвращался к этим желтым и жухлым страничкам и всякий раз убеждался, что они — лучшее, что я создал в этой жизни. Вполне естественно, что желание перевести свою диссертацию в электронный вид не покидало меня ни на одно мгновение. Я набрасывался на всякий новый пакет OCR, но вот что из этого получалось, я вам сейчас продемонстрирую.
Перед вами типичный образец оригинального текста:
По большому счету, ничего тут героического нет: ну бледненько все, ну буквы неравномерно отбились — эка невидаль! Машинистка у меня была профессиональная — брала по восемьдесят копеечек за страницу, поэтому опечаток и замазок — самая малость. Не тут-то было! Этот «исходник» оказался не по зубам всемOCR без исключения.
Читать дальшеИнтервал:
Закладка: