23.09.12
Нужны добровольцы
А как это будет выглядеть технически? В смысле - как получить материалы, и куда отправлять откорректированные?
Написать мне. Сообщить эл. адрес, на который я могу выслать сканы текстов. Потом клаву в руки и вперед!
Уже написал.
Я так понял, надо читать сканы и клавить их? Попробовать можно.
Именно так!
Можно преобразовать в формат DJVU, скажем, один файл на папку (дело/опись). И выложить куда-нибудь.
И что дальше? Кроме, того, выложить - это фактически сразу опубликовать, а это может не входить в планы МС. Проблема-то в правке, а не в доступе. Дежавю текст не распознает, и даже фактически не улучшит. Если иметь в виду - берить, что хотите, и правьте, то могут быть дубли и пропуски. Нужен координатор
Если DJVU будет в открытом доступе, то это тоже можно будет читать.
Какой формат файла на выходе? Word, txt, или другой?
Присоединяюсь к вопросу. Может, html устроит?
"И ты прав, и ты прав, и ты тоже прав" (с)
Все три формата подходят
Марк Семенович, привет! Освобождаюсь (не из мест пребывания, а от прежних дел) после 15-16 октября и сразу же жду посылки.
Е-mail: antondron@gmail.com
Всегда готов помочь. Только просьба: в каждом конкретном случае и при пересылке указывать предельно однозначно по любому документу - какой нужен результат после обработки материала. А знания по РККА - вроде бы звание обязывает!
До связи.
Страшное дело... Результатом "обработки" должно быть ТОЛЬКО точное воспроизведение текста, желательно - со всеми служебными пометами (которые можно прочитать). Никакой "обработки материала"!!! Мы же не архив МИД, который публикует документы с редакционной правкой.
Марк Семенович, извиняюсь но некоторые грамматические ошибки (никак не влияющие на смысл текста) я таки исправил. Если надо строго соблюдать орфографию оригинала сообщите пожалуйста.
По общепринятой практике грамматические ошибки НАДО исправлять.
Предельно ясно, спасибо. Принял к исполнению.
А ведь неплохую идею высказал один из коментаторов - Translatopedia. Берется скажем движок от википедии. Каждый документ вывешивается в виде статьи. Участники проекта либо переводят документ либо его уточняют. Опять же есть место куда поместить стандартные сокращения. Готовый workflow для разрешения конфликтов, возможность откатиться к предыдущей версии и т.д. Да такой машинкой можно любое кол-во исторических документов оцифровать или перевести!
MediaWiki.
Могу установить этот движок, если есть хостинг.
Хостинг на пару лет вперед я готов оплатить, если Марку это интересно. Без его авторитета это работать не будет
Уважаемый Марк Семенович! Также готов принять посильное участие в этом мероприятии. Подхожу по указанным Вами параметрам - пенсионер. Правда капраз, но с сухопутной терминологией знаком и абсолютную точность воспроизводимого материала гарантирую.
Как я понял, точное форматирование текста, соответствующее оригиналу необязательно. Предлагаю номера фонд, опись, дело, лист писать вначале текста крупным цветным шрифтом. То же и в заголовке письма. Так легче работать будет (наверное) для МС.
С буквой ё замучился. :)) Привык писать с ё, а там в оригинале без точек. :)) Но это, как я понял, ерунда. ...но, всё-таки...
Надписи сложновато воспроизводить. Но, пытаюсь... :)
С буквой ё замучился. :)) Привык писать с ё, а там в оригинале без точек.
Извините, уважаемый Владимир, но, коль скоро "Результатом "обработки" должно быть ТОЛЬКО точное воспроизведение текста", то и "ё" и "е" должны быть точно как в оигинале. Во всяком случае, я это так понимаю и собираюсь так делать.
Вот я и убирал "умлауты". :)) Ну, ещё там в самом низу типография и всё такое... тоже надо воспроизводить. И горизонтальная линия. :)
Да ерунда это. Главное - ошибки не допустить.
Уважаемый Марк, не обладая массой свободного времени и хорошим зрением, надеюсь все же внести свои скромные 5 копеек (центов, огород) в общее дело. :)
Об этом я Вам уже написал.
Спасибо.
Было бы неплохо образец такого распознавания разместить на сайте. Меньше будет сомнений и терзаний у "краудсорсинга".