Faq
rusconv v.3.11.
Полезные советы и ответы на типичные вопросы.
Содержание:
Как сделать, чтобы операционная система сама находила и запускала программы rusconv и whatrus?
Какие файлы можно конвертировать с помощью rusconv?
Для чтения почты используется Netscape. Пришло письмо в неправильной кодировке. Что делать?
С помощью Netscape Composer (или Frontpage, или еще какого-либо HTML-редактора) была создана HTML-страничка в кодировке windows. Rusconv преобразовал ее в кодировку КОИ-8. Почему вместо русского текста обозреватель выводит мусор?
На концах строк находятся странные символы. Как их убрать?
Можно ли использовать исходные тексты rusconv в своих программах?
Как лучше всего сделать ссылку на rusconv со своей HTML-странички?
Как сделать, чтобы операционная система сама находила и запускала программы rusconv и whatrus?
В DOS и windows создайте какой-нибудь каталог, в котором будут находиться rusconv и whatrus, например, C:\UTIL. Скопируйте в него rusconv и whatrus. Отредактируйте файл C:\AUTOEXEC.BAT: в нем в переменную PATH добавьте директорию C:\UTIL. Для этого проще всего на последней строке файла написать команду
PATH=%PATH%;C:\UTIL
После перезагрузки, rusconv и whatrus можно будет запустить из любой директории.
В UNIX, если Вы являетесь системным администратором, rusconv и whatrus лучше всего скопировать в директорию /usr/local/bin. Тогда эти утилиты будут доступны всем пользователям. Если же у Вас нет прав на это, то можно создать в своем домашнем каталоге директорию bin и скопировать программы туда. Обычно переменная PATH настроена правильно и содержит эту директорию. В противном случае, надо отредактировать файл начальных установок (скорее всего, ~/.bashrc) и повторно войти в систему.
Какие файлы можно конвертировать с помощью rusconv?
С помощью rusconv можно конвертировать любые файлы, содержащие текст. Среди них - '.txt', '.html', '.tex', '.rtf',
исходные тексты программ и другие. Документы (.doc-файлы), создаваемые с помощью Microsoft Word, не являются текстовыми, и при использовании rusconv могут быть испорчены.
Для чтения почты используется Netscape. Пришло письмо в неправильной кодировке. Что делать?
Вначале надо просто поменять кодировку, используемую для просмотра почты. Если это не помогает, создаем новую папку с письмами (File->New Folder...). Называем ее, например, recover и копируем в нее письмо. Смысл всего этого в том, что создается файл с именем типа C:\Program files\Netscape\Users\<Ваше имя>\mail\recover. Он содержит сообщение в том виде, в котором его получил Netscape и, что самое главное, этот файл - текстовый. Теперь можно определить его кодировку, и с помощью rusconv привести его к читаемому виду.
Лучше всего перевести текст в ту кодировку, в которой он был отправлен. Тогда Netscape будет выводить письмо правильно. Чтобы определить исходную кодировку, нужно открыть файл 'recover' и найти в нем строчку типа Content-type: text/plain; charset=koi8-r.
С помощью Netscape Composer (или Frontpage, или еще какого-либо HTML-редактора) была создана HTML-страничка в кодировке windows. Rusconv преобразовал ее в кодировку КОИ-8. Почему вместо русского текста обозреватель выводит мусор?
С помощью специальных тегов можно сказать обозревателю, какой набор символов использовать для вывода HTML-страницы. Причем отказаться от него невозможно - что бы Вы ни выбрали в меню View->Encoding, будет использоваться все равно он.
Большинство HTML-редакторов автоматически добавляют команду задания кодировки. Если сконвертировать файл вне этого редактора, то страничка окажется в другой кодировке, а команда останется без изменения. Из-за этого в данном примере обозреватель использует кодировку windows для отображения странички в КОИ-8. Неудивительно, что вместо текста выводится мусор.
Один из вариантов решения проблемы - переводить HTML-файл в самом редакторе (если он это позволяет). Другой путь - использовать rusconv для конвертирования, а затем в новой версии файла найти строку
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=windows-1251">
и заменить поле charset на правильное (например, koi8-r). Но лучше всего - удалить эту строку.
На концах строк находятся странные символы. Как их убрать?
Первый вариант. Вы работаете в операционный системе UNIX. Возможно, в тексте используется DOS/windows-формат кодирования концов строк. Чтобы преобразовать файл в UNIX-формат, используйте флаг 'crlf2cr'.
Второй вариант. Вы работаете в DOS или windows. Возможно, вы случайно изменили тип концов строк из UNIX-формата в DOS-формат, причем строки уже были в DOS-формате. Для исправления файла запустите rusconv дважды - вначале с флагом '-crlf2cr', а затем с флагом '-cr2crlf'.
Третий вариант. Тип концов строк ни при чем. В этом случае удалить лишние символы можно вручную.
Можно ли использовать исходные тексты rusconv в своих программах?
Вносить изменения в исходные тексты и создавать свои версии программ rusconv и whatrus - нельзя. Но использовать части кода в своих проектах - можно. При этом желательно указать в документации, что использованы исходные тексты rusconv или whatrus, а также дать адрес web-узла rusconv (http://beta.math.spbu.ru/~prof/w_re/).
Как лучше всего сделать ссылку на rusconv со своей HTML-странички?
Как Вам больше нравится. Адрес web-узла rusconv:
http://beta.math.spbu.ru/~prof/w_re/
По умолчанию загрузится windows-версия. Начальные странички в других кодировках имеют адреса:
http://beta.math.spbu.ru/~prof/w_re/index.html - windows http://beta.math.spbu.ru/~prof/w_re/index-k.html - КОИ-8 http://beta.math.spbu.ru/~prof/w_re/index-l.html - latinica http://beta.math.spbu.ru/~prof/w_re/index-e.html - english
Приятной работы!
faq.html
Документ создан Паращенко Олегом
Последние изменения - 15 ноября 1998 года