Scrierea unei pagini de Web in HTML



Scrierea unei pagini de Web in HTML


Paginile de Web sunt scrise intr-un limbaj numit HTML (Hypertext Markup Language limbaj de marcare hipertext). HTML permite utilizatorilor sa produca, pagini care includ texte, grafica si indicatori la alte pagini de Web. Vom incepe sa studiem HTML eu acesti indicatori, pentru ca ei reprezinta tocmai mecanismul care tine Web-ul conectat



URL- Uniform Resource Locators

O pagina de Web poate sa contina referinte la alte pagini. Sa explicam cum sunt implementate aceste referinte. Inca de la crearea Web-ului a fost clar ca pentru a avea o pagina care sa indice spre alta pagina este necesar un mecanism care sa permita numirea si regasirea paginilor. In particular sunt trei intrebari la care trebuie sa se raspunda inainte de a se putea afisa o pagina:

l. Cum se numeste pagina ?

2. Cum este localizata pagina ?

3. Cum se face accesul la pagina ?

Daca fiecare pagina ar avea un nume unic, atunci nu ar exista nici o ambiguitate in identificarea paginilor. Totusi, problema nu este inca rezolvata. Sa consideram de exemplu o paralela intre oameni si pagini. In SUA aproape fiecare persoana are un numar de asigurare sociala; care este un identificator unic, astfel incat nu exista doua persoane cu acelasi numar. Totusi, cunoscand numai numarul respectiv nu exista nici o posibilitate de a gasi adresa persoanei respective, si sigur nu se poate afla daca persoanei respective trebuie sa i se scrie in engleza, spaniola sau chineza. Web-ul are practic acelasi fel de probleme.

Solutia aleasa identifica paginile intr-un mod care rezolva toate trei problemele in acelasi timp. Fiecare pagina are un URL (Uniform Resource Locater - adresa uniforma pentru localizarea resurselor) care functioneaza ca nume al paginii general valabil. Un URL are trei componente: protocolul, numele DNS al masinii pe care este memorat fisierul si un nume local, care indica in mod unic pagina (de obicei numele fisierului care contine pagina). De exemplu, URL-ul departamentului din care face parte autorul este:

https://www.cs.vu.nl/welcome.html

Acest URL este format din trei componente: protocolul (http), numele DNS al serverului (www.cs.vu.nd) si numele fisierului (welcome.html), cu semnele de punctuatie corespunzatoare.

Se utilizeaza notatii care reprezinta prescurtari standard. De. exemplu user/ poate sa fie pus in corespondenta cu directorul WWW al utilizatorului user, folosind conventia ca o referinta la directorul respectiv implica un anumit fisier, de exemplu index.html. De exemplu pagina autorului poate sa fie referita ca:

https://www.cs.vu.nl/~ast/

chiar daca de fapt numele fisierului este diferit. Pe multe servere un nume de fisier indica implicit pagina organizatiei careia ii apartine serverul.

Acum ar trebui sa fie clar cum functioneaza hipertextul. Pentru a face o portiune de text selectabila, cel care scrie pagina trebuie sa furnizeze doua elemente: textul prin care se face selectia si URL-ul paginii care trebuie adusa daca textul este selectat. Cand se face selectia, programul de navigare cauta numele serverului utilizand DNS-ul. Pe baza adresei IP a serverului, programul de navigare stabileste o conexiune TCP spre server. Utilizand aceasta conexiune, se transmite numele fisierului utilizand protocolul specificat. Bingo. Acum soseste pagina.


Protocolul http este protocolul nativ pentru Web; e1 este utilizat de catre serverele de HTTP.

Protocolul ftp este utilizat pentru accesul la fisiere prin FTP (File Transfer Protocol - ­protocol pentru transferul de fisiere), protocolul Internet de transfer de fisiere. FTP este utilizat de peste douazeci de ani si este foarte raspandit. Numeroase servere de FTP din toata lumea permit ca de oriunde din Internet sa se faca o conectare si sa se aduca orice fisier plasat pe un server FTP. Web-ul nu aduce schimbari aici, face doar ca obtinerea fisierelor sa se faca mai usor, pentru ca FT'P are o interfata mai putin prietenoasa. In viitor probabil ca FTP-ul va dispare, deoarece nu exista nici un avantaj pentru o organizatie sa aiba un server de FTP in loc de un server de HTTP, care poate sa faca tot ce face un server de FTP, si chiar mai mult (desigur mai exista niste argumente legate de eficienta).

Este posibil sa se faca acces la un fisier local ca la o pagina de Web, fie utilizand protocolul file (fisier), sau pur si simplu utilizand numele fisierului. Aceasta abordare este similara utilizarii protocolului FTP, dar nu implica existenta unui server. Desigur functioneaza numai pentru fisiere locale.



Pe scurt URL-urile au fost proiectate nu numai pentru a permite utilizatorilor sa navigheze prin Web, dar si pentru a utiliza FTP, news, Gopher, email si telnet, ceea ce face inutile interfetele specializate pentru aceste protocoale integrand astfel intr-un singur program, navigatorul in Web, aproape toate tipurile de acces in Internet. Daca metoda nu ar fi fost proiectata de un fizician ar fi putut sa para produsul departamentului de publicitate al unei companii de software.

In ciuda tuturor acestor proprietati, cresterea Web-ului scoate in evidenta si o slabiciune a metodei utilizarii URL-urilor. Pentru o pagina care este foarte des referita, ar fi de preferat sa existe mai multe copii pe servere diferite, pentru a reduce traficul in retea. Problema este ca URL-urile nu ofera nici o posibilitate de indicare a unei pagini fara sa se specifice unde este localizata pagina respectiva. Nu exista nici o metoda pentru a spune ceva de genul: "Vreau pagina xyz, dar nu ma intereseaza de unde o aduci". Pentru a rezolva aceasta problema si a permite multiplicarea paginilor IETF lucreaza la un sistem de URL (Universal Resource Identifiers - identificatori universali de resurse). Un URL poate sa fie privit ca un URL generalizat. Acest subiect este in curs de cercetare.


Documentatie: Andrew Tannenbaum - "Retele de calculatoare"