Rozróżniamy przede wszystkim dwa rodzaje plików: tekstowe i binarne. Nazwy są trochę mylące, bo wszystkie pliki są binarne, czyli ,,zero-jedynkowe''. Jednak pliki tekstowe zajmują wśród nich wyróżnioną pozycję, sposób ich odczytywania jest bowiem najbardziej w świecie komputerów rozpowszechnionym standardem. Znajdują się w nich litery, zamienione na bity według przepisu z rozdziałów 3.3 i 3.4. Zapisany w ten sposób plik można odczytać na dowolnym komputerze, niezależnie od systemu operacyjnego itp. W dodatku ,,odczytać'' możemy tu rozumieć dosłownie, gdyż po zamianie bitów na litery (czyli wyświetleniu pliku ASCII) pojawia się tekst, zwykle zrozumiały dla człowieka. Może nie zawsze całkiem zrozumiały, ale przynajmniej powinniśmy zgadnąć, czy jest to sprawozdanie, list, tekst strony WWW (rys. 5.3) czy kod źródłowy programu (tabl. 3.1).
Ale nie wszystko najwygodniej opisywać literami -- na przykład obrazy. W tym przypadku bity interpretujemy
zupełnie inaczej -- jako liczby opisujące kolory kolejnych maleńkich fragmentów obrazu (pikseli).
Ale po samych bitach nie rozróżnimy, czy opisują tekst, czy obraz! Dlatego musimy (my lub korzystające
z plików programy, czyli w tym przypadku edytory tekstów lub programy graficzne) wiedzieć,
jakiego typu informacja znajduje się w pliku i jak ją interpretować. W przeciwnym razie, jeśli liczby
opisujące obraz będziemy chcieli interpretować jako tekst (wczytując do edytora tekstów), dostaniemy
bezsensowną sekwencję typu ,,*5&^%\maketitle
Ogólnie, pliki binarne to wszystkie pliki nietekstowe. Mogą zawierać obrazy, dźwięki, filmy lub dowolne dane. Jeśli zapisano je w jednym z ogólnie przyjętych standardów (jak na przykład te z tabl. 4.1), to zwykle daje się je odczytać (czyli sensownie wyświetlić lub odegrać) na większości komputerów, jeśli tylko zainstalowano na nich odpowiednie programy.
Plik może też zawierać program komputerowy -- wtedy zrozumiały jest tylko dla tego systemu operacyjnego, dla którego przeznaczony jest program4.2. Na przykład program napisany dla MS Windows (którego nazwa kończy się zwykle na ,,.exe'') można uruchomić na każdym komputerze z (odpowiednią wersją) MS Windows. Nie da się go uruchomić pod żadnym innym systemem operacyjnym, np. MacOS czy GNU/Linux4.3. Standardowe formaty plików graficznych, muzycznych, no i oczywiście tekstowych, powinny dać się wyświetlić na większości komputerów (jeśli zainstalowano odpowiednie programy).
Program może czasem po prostu odtwarzać film czy animację. Dla użytkowników tego samego systemu będzie on łatwiejszy do odtworzenia od zapisu filmu w którymś ze standardowych formatów (np. star.avi, *.mpg), gdyż nie wymaga, żeby na komputerze był zainstalowany program obsługujący dany format. Ale, szczególnie w MS Windows, odtwarzanie takich programów, ,,znalezionych'' w Internecie czy otrzymanych od znajomych pocztą elektroniczną, niesie ze sobą niebezpieczeństwo uszkodzenia systemu przez wirus, którym program może być ,,zainfekowany'' (problem ten opisano bliżej w rozdziale 4.4). Warto zapamiętać, że przesyłając pocztą niewinnie zabawne ,,programiki'', możemy narazić adresata na utratę danych (chyba że pracuje w innym systemie operacyjnym i po prostu nie będzie mógł programu uruchomić).
Plik może też zawierać dane zapisane przez jakiś program w formacie niezgodnym
z żadnym powszechnym standardem. Wtedy do ich odczytania potrzebny jest ten właśnie program (lub inny,
potrafiący ,,importować'', czyli wczytywać, zapisane przez ten program dane).
Dotyczy to również tekstów. Gdybyśmy pozostali przy treści, czyli samym tekście, wystarczyłby standard ASCII.
Jednak coraz częściej nad treścią dominuje forma -- w najprostszym liście trafia się nawet kilka różnych czcionek.
Informacja o rozmiarach i rodzajach czcionek, jak również rozmieszczeniu tekstu na stronie,
nie doczekała się standardowego formatu zapisu -- producent każdego programu uważa swój format za jedynie
słuszny. Jedynym dość rozpowszechnionym standardem jest oparty na ASCII rich text format (pliki *.rtf
),
jednak nie daje on tylu możliwości udziwniania tekstu, jak niestandardowe formaty różnych
programów, stąd ograniczona popularność.
Skoro z samych bitów trudno zgadnąć rodzaj pliku, pozostaje wykorzystać do tego celu nazwę.
Końcowa część nazwy pliku, tradycyjnie oddzielana kropką, jest zwykle przeznaczona do określenia jego typu.
Na przykład w nazwie sprawozdanie_z_maja.txt
człon .txt, czyli rozszerzenie nazwy, oznacza typ pliku (tekstowy, zwykle ASCII). Właściwa nazwa,
która powinna kojarzyć się z zawartością, to sprawozdanie_z_maja
. Pliki z rozszerzeniem ,,txt'' określamy
często jako ,,*.txt
'', gdzie ,,*
'' zastępuje dowolny ciąg znaków.
Rozszerzenia plików mogą być przez system kojarzone z konkretnymi programami, zdolnymi do wyświetlania i/lub edycji plików danego formatu. Stąd często kliknięcie pliku, którego rozszerzenie jest przez system skojarzone z obsługującym ten typ programem, wystarcza do uruchomienia odpowiedniego programu i otwarcia pliku.
WordPerfect (edytor tekstów) | *.wp, *.doc |
MS Word (edytor tekstów) | *.doc |
MS Excel (arkusz kalkulacyjny) | *.xls, *.xlw |
MS Access (baza danych) | *.mdb |
DBase (baza danych) | *.db |
Corel Draw! (program graficzny) | *.cdr |
Corel PhotoPaint | *.cpt |