|
Przglądając różnego rodzaju dokumentacje, dość często trafiamy na teksty stworzone
na innych komputerach. Jeżeli są one w języku innym niż polski to jeszcze da radę je odczytać (choć i w tym wypadku jest
to niewygodne i uciążliwe), gdy jednak zawierają one polskie literki to już jest poważny kłopot!
Na Atari powstało sporo różnego rodzaju konwenterów tekstu, ale większość z nich
umożliwia tylko zmianę znaków końca linii (EOL) i z tego też powodu używanie ich do konwersji polskich tekstów jest
raczej bezcelowe. Kilka lat temu Szymon/Dial stworzył (pierwszy?) program umożliwiający konwersję także polskich znaków.
Obsługiwał on kilka formatów (np. AmigaPL, Mazovia, Latin2). Wadą programu było to iż nie usuwał (lub nie dodawał) EOL'a
(chodzi oczywiście o teksty z PC, gdzie koniec linii oznaczony jest dwoma znakami o kodach 13, 10 (CR, LF). Znacznie
później powstał D-Trans (Dial), który posiada opcję konwersji tekstu zawierającego polskie znaki. Niestety, także i w
tym wypadku EOL'e nie były poprawnie konwenterowane.
Text Converter dla DC pozbawiony jest opisywanej wady! Oprócz tego posiada kilka
opcji pomocnych podczas konwersji np. usuwanie znaków większych od 127, konwersję znaków specjalnych (określonych przez
użytkownika) oraz usunięcie inwersji (głównie dla tekstów napisanych na Atari). O działaniu tych opcji decyduje
oczywiście użytkownik! Kolejną zaletą programu jest to iż dane nie są buforowane, a to umożliwia konwersję plików o
dowolnej długości (dane odczytywane są z urządzenia źródłowego do bufora roboczego, konwenterowane i automatycznie
zapisywane na urządzeniu docelowym). Program potrafi obsłużyć KAŻDY standard polskich znaków! Wszystkie standardy
aktualnie obsługiwane zawarte są w pliku TXTCNV.CFG (jest on odczytywany podczas uruchomienia programu). Dodatkowe
standardy można dopisać przy pomocy dowolnego edytora tekstu zapisującego plik w formacie ATASCII (np. Panther lub
Notebook z DC). Maksymalnie można zdefiniować 62 standardy!
Informacje podstawowe
Text Converter (w skrócie TC) będzie poprawnie pracował tylko pod DOS Control'em
wersja 2.x! MemLo nie powinno przekraczać $2800.
Przed uruchomieniem programu odczytywany jest plik konfiguracyjny TXTCNV.CFG (opis
formatu tego pliku znajdziesz w dalszej części dokumentacji). Jeżeli TC nie znajdzie tego pliku lub wystąpi błąd podczas
jego odczytu to na ekranie ukaże się informacja o tym i zostaną ustawione formaty standardowe. Po uruchomieniu na
ekranie ukaże się okno robocze programu. Podzielone ono zostało na kilka mniejszych okienek. Patrząc od góry widzimy:
| SOURCE |
- |
znajdują się tutaj informacje o urządzeniu, nazwie pliku oraz formacie tekstu źródłowego. |
| DESTINATION |
- |
znajdują się tutaj informacje o urządzeniu, nazwie pliku oraz formacie tekstu docelowego. |
|  |
Pod oknem SOURCE znajduje się okienko z dostępnymi formatami, a poniżej znajduje się informacja o ich ilości (FORMATS:
xx). Pod oknem DESTINATION znajduje się główne menu programu.
Menu
Opcje z menu wybieramy przy pomocy klawiszy [- =], [RETURN] uruchamia daną opcję, a
[ESC] umożliwia powrót do DOS Control'a. Przy pomocy klawisza [+] możemy przejść do okienka z dostępnymi formatami (aby
np. zobaczyć co mamy zdefiniowane). Dodatkowo ZAWSZE aktywny jest klawisz [TAB], który umożliwia podgląd głównego ekranu
DOS Control'a. Po jego wybraniu okno TC zostaje schowane i program oczekuje na naciśnięcie dowolnego klawisza. Oto
dostępne opcje:
CONVERSION (Konwersja)
Umożliwia rozpoczęcie konwersji. W przypadku wystąpienia błędu operacja ta zostaje
przerwana, a na ekranie ukaże się jego numer. Jak wspomniałem wcześniej, TC potrafi skonwenterować plik o dowolnej
długości (ograniczenie to jedynie pojemność nośnika). Jeżeli konwenterujemy tekst przy pomocy jednego urządzenia (np.
"D1:") to należy pamiętać o tym aby zmienić nazwę pliku docelowego, gdyż zostanie on stworzony na dysku z którego
odczytywany był plik źródłowy (nie ma możliwości zmiany dysku).
CHANGE FILENAMES (Zmiana nazwy plików)
Normalnie po uruchomieniu programu, informacje o urządzeniu i nazwie pliku
źródłowego pobierane są z panelu DOS Control'a, w którym się znajdowaliśmy uruchamiając TC (podświetleniem należy
wskazać nazwę pliku). Urządzenie docelowe określa drugi panel DC (nazwa pliku pozostaje bez zmian). Przy pomocy tej
opcji możemy zmienić (lub podać nowe) urządzenie oraz nazwę pliku. Po jej wybraniu w okienku SOURCE ukaże się kursor.
Teraz możemy dokonać zmian. Klawisze funkcyjne to (^ oznacza [CONTROL], ! oznacza [SHIFT]):
| [ESC] |
- |
przerwanie tej operacji (zostanie przywrócona poprzednia nazwa i nastąpi powrót do menu) |
| [RETURN] |
- |
akceptacja i przejście do okna DESTINATION. |
| [^+],[^*] |
- |
kursor lewo/prawo |
| [DELETE] |
- |
skasowanie poprzedniego znaku |
| [!DELETE] |
- |
skasowanie całego pola (można także nacisnąć [^DELETE]). |
| [TAB] |
- |
podgląd ekranu DOS Control |
W okienku DESTINATION postępujemy identycznie. Tu jednak klawisz [RETURN] kończy
edycję (następuje powrót do menu). Jeżeli od razu chcesz przejść do okna DESTINATION to przed wybraniem opcji CHANGE
FILENAMES naciśnij [BREAK].
SOURCE FORMAT (Format źródłowy)
Przy pomocy tej opcji określamy standard tekstu źródłowego. Po wybraniu przenosimy
się do okna ze zdefiniowanymi standardami. Przy pomocy klawiszy kursora (góra/dół) wybieramy interesujący nas format i
naciskamy [RETURN]. Klawisz [ESC] umożliwia powrót do menu bez zmiany formatu. Aktywny jest także klawisz [TAB].
DESTINATION FORMAT (Format docelowy)
Tu określamy standard docelowy. Postępujemy tak jak przy wyborze formatu źródłowego.
SCREEN OFF-WRITE (Wyłączenie ekranu)
Jeżeli jest zaznaczona [x] to podczas zapisu ekran zostanie wyłączony. Oczywiście w
przypadku błędów lub zakończeniu tej operacji zostanie on ponownie włączony.
POLISH CHARS (Polskie znaki)
Jeżeli jest zaznaczona [x] to TC będzie konwenterował polskie znaki. Jeżeli będzie
wyłączona to konwersji ulegną tylko znaki końca linii (EOL).
SPECIAL CHARS (Znaki specjalne)
Jeżeli jest zaznaczona [x] to TC będzie je brał pod uwagę podczas konwersji.
Standardowo, w pliku dołączonym do TC podane są znaki:
dla Atari (PANTHER):
| minus |
"-" |
($2d) |
| nawias kwadratowy otwierający |
"[" |
($5b) |
| nawias kwadratowy zamykający |
"]" |
($5d) |
dla pozostałych (np. AMIGAPL):
| tylda |
"~" |
($7e) |
| nawias klamrowy otwierający |
"{" |
($7b) |
| nawias klamrowy zamykający |
"}" |
($7d) |
Tak więc np. podczas konwersji z AmigaPL na Panther, wszystkie tyldy oraz nawiasy
klamrowe zostaną zastąpione minusem oraz nawiasami kwadratowymi. Pomysł zaczerpnięty został z artykułu Dracon'a
zamieszczonego w Syzygy #7. Oczywiście użytkownik może dowolnie zmieniać te znaki w pliku konfiguracyjnym.
UNINVERSE (Usuń inwersję)
Jeżeli jest zaznaczona [x] to TC będzie usuwał inwersję (kasowany będzie 7 bit
każdego znaku). Opcja przeznaczona jest głównie dla tekstów napisanych na Atari.
REMOVE >127 (usuń znaki >127)
Jeżeli jest zaznaczona [x] to TC będzie usuwał wszystkie znaki, których kody są
większe od 127. Operacja ta jest wykonywana po konwersji polskich znaków, a więc nie zostaną one usunięte (o ile nie są
w inwersji - chodzi o teksty z Atari)! Opcja przeznaczona jest głównie dla tekstów napisanych na innych komputerach niż
Atari i umożliwia usunięcie różnych "śmieci" z tekstu.
UWAGA! Operacja usuwania inwersji wykonywana jest przed tą operacją, a więc chcąc
usuwać takie znaki należy wyłączyć opcję UNINVERSE!
ABOUT
Informacje o programie oraz autorze.
EXIT TO DOS CONTROL
Powrót do DOS Control'a.
UWAGA! Wszytkie ustawione opcje zostaną zapisane wraz z ustawieniami DOS Control'a.
Plik TXTCNV.CFG
Jak wspomniałem na początku, przed uruchomieniem głównej części TC odczytywany jest
plik konfiguracyjny (zawsze z tego urządzenia, z którego został odczytany TC). Plik ten jest w formacie ATASCII, a więc
można go wczytać np. do edytora Panther i dowolnie go poprawiać.
Budowa definicji standardu
- Nazwa standardu (maksymalnie 10 znaków). Powinna być wpisana w inwersji, ale nie jest to wymagane. Jeżeli nazwa będzie dłuższa to spowoduje to błąd (SYNTAX ERROR) i zostaną ustawione wartości standardowe.
- Kody polskich DUŻYCH liter dla danego standardu, wpisyjemy w HEX'ach (bez dolara). Separatorem może być dowolny znak (zalecany przecinek).
- Kody polskich MAŁYCH liter dla danego standardu, wpisyjemy w HEX'ach (bez dolara). Separatorem może być dowolny znak (zalecany przecinek).
- Kody końca linii (EOL) dla danego standardu, wpisyjemy w HEX'ach (bez dolara). Separatorem może być dowolny znak (zalecany przecinek). Jeżeli jest to tylko jedna wartość to jako drugą ZAWSZE wpisz 00.
- Kody znaków specjalnych dla danego standardu, wpisyjemy w HEX'ach (bez dolara). Separatorem może być dowolny znak (zalecany przecinek). Maksymalnie można zdefiniować trzy znaki.
Uwagi
- wartości można podawać małymi lub dużymi literami
- każda linia MUSI być zakończona EOL'em
- można umieścić komentarz. Poprzedzić go należy jednym ze znaków ";", "*", "|"
- jeżeli jakaś linia będzie zawierała niedozwolony znak lub będzie ich za mało, za dużo to ukaże się odpowiedni komunikat (w TC) i zostaną ustawione standardowe formaty (zdefiniowane w TC)
- maksymalnie można zdefiniwać 62 standardy
- plik konfiguracyjny nie może być większy niż 8 kilobajtów, a jeżeli będzie to reszta nie zostanie wzięta pod uwagę.
Aby nie było żadnych wątpliwości proszę przeglądnąć także plik TXTCNV.CFG znajdujący się na dysku systemowym DC.
|