Network Working Group D. Connolly Request for Comments: 2854 World Wide Web Consortium (W3C) Obsoletes: 2070, 1980, 1942, 1867, 1866 L. Masinter Category: Informational AT&T June 2000 Il Tipo Media 'text/html' Traduzione a cura di ComiSAT Brescia, Giu. 2004 (comisat@yahoo.it) Distribuita da .::http://www.rfc.altervista.org::. Stato di questo Documento Questo documento fornisce informazioni per la comunita' Internet. Non specifica uno standard Internet di alcun genere. La distribuzione di questo documento non e' soggetta a limitazioni. Nota di Copyright Copyright (C) The Internet Society (2000). All Rights Reserved. Sunto Questo documento ricapitola la storia dello sviluppo dell'HTML e definisce il tipo MIME "text/html" indicando le relative raccomandazioni W3C; si intendeno resi obsoleti i precedenti documenti IETF che definiscono l'HTML, comprese le RFC 1867, 1980, 1942 e 2070, e rimosso l'HTML dalle Tracce Standards IETF. Questo documento e' stato preparato su richiesta del Gruppo di Lavoro HTML del W3C. Si inviino gentilmente commenti a www-html@w3.org, una mailing list pubblica con archivio su http://lists.w3.org/Archives/Public/www-html/. 1. Introduzione e background L'HTML e' stato in uso nell'infrastruttura d'informazione World Wide Web sin dal 1990, e specificato in diversi documenti informali. Il tipo di media text/html e' stato il primo ufficialmente definito dal gruppo di lavoro HTML dell'IETF nel 1995 nell' [HTML20]. Estensioni all'HTML furono proposte con [HTML30], [UPLOAD], [TABLES], [CLIMAPS] e [I18N]. Il gruppo di lavoro HTML dell'IETF chiuse nel Settembre 1996, e il lavoro di definizione dell'HTML si sposto' al World Wide Web Consortium (W3C). Le estensioni proposte furono incorporate in parte nel ]HTML32] e in maggiore quantita' nel [HTML40]. La definizione di multipart/form-data da [UPLOAD] fu descritta nel [FORMDATA]. In piu', e' stata sviluppata una riformulazione dell'HTML 4.0 secondo le norme XML 1.0 [XHTML1]. Connolly & Masinter Informational [Page 1] RFC 2854 The 'text/html' Media Type June 2000 L'[HTML32] riporta "Questa specifica definisce l'HTML versione 3.2. L'HTML 3.2. ha lo scopo di catturare le pratiche raccomandate prima del '96 in modo da essere utilizzate in sostituzione dellìHTML 2.0 (RFC 1866)." Specifiche successive dell'HTML descrivono le differenze in ciascuna versione. In aggiunta allo sviluppo degli standards, un'ampia varieta' di estensioni supplementari, restrizioni e modifiche all'HTML furono diffuse dal sistema Mosaic dell'NCSA e successivamente da implementazioni competitive di Netscape Navigator e Microsoft Internet Explorer; queste estensioni sono documentate in numerosi libri e guide ondine. 2. Registrazione del tipo di media MIME text/html nome del tipo di media MIME: text nome del sottotipo MIME: html parametri richiesti: nessuno parametric facoltativi: charset Il parametro opzionale "charset" si riferisce alla codifica dei caratteri usata per rappresentare il documento HTML come una sequenza di bytes. Puo' essere utilizzato un qualsiasi set di caratteri IANA, tuttavia e' da preferire l'UTF-8. Sebbene questo parametro sia facoltativo, e' vivamente raccomandato che esso sia sempre presente. Si veda la Sezione 6 piu' avanti per una discussione sulle regole del set di caratteri di default. Si noti che l'[HTML20] includeva un parametro facoltativo "level"; nella pratica, questo parametro non e' mai stato usato ed e' stato rimosso dalla specifica. [HTML30] suggeriva inoltre un parametro "version"; nella pratica, questo parametro non e' mai stato usato ed e' stato rimosso dalla specifica Considerazioni sulla codifica: Vedasi la Sezione 4 di questo documento. Considerazioni sulla sicurezza: Vedasi la Sezione 7 di questo documento. Considerazioni sull'interoperabilita': L'HTML e' stato disegnato per essere interoperabile attraverso il piu' ampio numero possible di piattaforme e dispositivi di diverse caratteristiche. Ad ogni modo vi sono contesti (piattaforme con ridotte capacita' di display, ad esempio) nei quali non tutte le funzionalita' della piena definizione dell'HTML sono fattibili. E' in atto un lavoro continuo per sviluppare sia una modularizzazione dell'HTML che un insieme di delineamento delle possibilita' per identificare e negoziare le funzionalita' ristrette (ed estese). Connolly & Masinter Informational [Page 2] RFC 2854 The 'text/html' Media Type June 2000 Dato lo sviluppo lungo e distribuito dell'HTML, l'attuale pratica su Internet include un'ampia varieta' di varianti HTML. Gli implementatori di interpreti test/html devono essere pronti per essere "bug-compatibili" con i browsers famosi in modo da lavorare con i molti documenti HTML disponibili su Internet. Solitamente, versioni differenti sono distinguibili mediante la dichiarazione del DOCTYPE contenuto all'interno, sebbene il DOCTYPE stesso viene talvota omesso o e' incorretto. Specifica pubblicata: Il tipo media text/html viene ora definito dalle Raccomandazion W3C; l'ultima versione pubblicata e' [HTML401]. Inoltre, [XHTML1] definisce un profilo d'uso dell'XHTML il quale e' compatibile con HTML 4.01 e puo' essere anche etichettato come text/html. Applicazioni che usano questo tipo: La prima e' la piu' commune applicazione dell'HTML e' il World Wide Web; comunemente, I documenti HTML contengono riferimenti [URI] ad altri documenti e media da richiamare usando il protocollo http [HTTP]. Molte applicazioni gateway forniscono interfacce HTML-based ad altri complessi servizi sottostanti. Numerose altre applicazioni utilizzano ora anche l'HTML come una conveniente piattaforma-indipendente per rappresentazione di documenti multimediali. Informazioni aggiuntive: Numero magico: Non vi e' alcuna singola stringa iniziale che e' sempre presente per i files HTML. Ad ogni modo, la Sezione 5 seguente fornisce alcune linee guida per il riconoscimento di files HTML. Estensione del file: Le estensioni di file 'html' o 'htm' sono comunemente utilizzate, ma altre estensioni che denotano formati di file per l'elaborazione preliminare sono comunque comuni. Codice per il Tipo di File Macintosh: TEXT Persona & relativa email da contattare per ulteriori informazioni: Dan Connolly Larry Masinter Connolly & Masinter Informational [Page 3] RFC 2854 The 'text/html' Media Type June 2000 Uso previsto: COMUNE Autore/Revisore: La specifica HTML e' un prodotto del Gruppo di Lavoro HTML del World Wide Web Consortium. Il W3C revisiona la specifica HTML. Ulteriori informazioni: L'HTML ha la possibilita' di includere, attraverso riferimenti via URI, risorse addizionali (immagini, video, applet) all'interno del documento base. Per poter trasferire un completo oggetto HTML e le risorse incluse in un singolo oggetto MIME, puo' essere utilizzato i meccanismo di [MHTML]. 3. Identificatori di Frammento La specifica URI [URI] nota che la semantica di un identificatore di frammento (la parte di un URI successive a '#') e' una proprieta' del dato risultante da un'azione di recupero, e che il formato e l'interpretazione degli identificatori di frammento dipendono dal tipo di media del risultato del recupero. Per i documenti identificati come text/html, l'identificatore di frammento indica l'elemento chiamato corrispondentemente; ciascun elemento puo' essere chiamato con l'attributo "id", e gli elementi A, APPLET, FRAME, IFRAME, IMG e MAP possono essere chiamati con un attributo "name". Questo viene descritto in dettaglio nella sezione 12 di [HTML40]. 4. Considerazioni sulla Codifica Data la disponibilita' all'interno dell'HTML stesso di uso di riferimenti a entita' carattere, i documenti che utilizzano un ampio repertorio di caratteri possono anche essere rappresentati utilizzando il set di caratteri US-ASCII e trasportati senza codifica. Ad ogni modo, il trasporto di text/html utilizzando un set di caratteri diverso dall'US-ASCII puo' richiedere codifica base64 o stampabile per canali a 7-bit. Come con tutti i sottotipi di testo MIME, la forma canonica di "text/html" deve sempre rappresentare un'interruzione di linea come una sequenza di un byte CR (0x0D) seguito da un byte LF (0x0A) [N.d.T. - CR=Carriage Return, LF=Line Feed, insieme costituiscono il 'ritorno a capo']. Similmente, un qualsiasi caso ove si verifica tale sequenza CRLF in "text/html" questa deve rappresentare una interruzione di linea. L'uso di un CR e LF al di fuori di una interruzione di linea e' inoltre proibito. Tale regola si applica comunque a prescindere dalla codifica di caratteri ('charset') coinvolta. Connolly & Masinter Informational [Page 4] RFC 2854 The 'text/html' Media Type June 2000 Si noti comunque che il protocollo HTTP consente il trasporto di dati in forma non canonica e, in particolare, con altre convenzione di end-of-line [N.d.T. - interruzione di linea]; si veda [HTTP] sezione 3.7.1. Tale eccezione viene comunemente usata nell'HTML. L'HTML spedito via email e' anche soggetto alle restrizioni MIME; questo viene discusso pienamente in [MHTML] Sezione 10. 5. Riconoscere files HTML Quasi tutti i files HTML hanno la stringa "). Connolly & Masinter Informational [Page 6] RFC 2854 The 'text/html' Media Type June 2000 [HTML32] Raggett, D., "HTML 3.2 Reference Specification", W3C Recomendation, January 1997. Available at . [HTML40] Raggett, D., et al., "HTML 4.0 Specification", W3C Recommendation, December 1997. Available at [HTML401] Raggett, D., et al., "HTML 4.01 Specification", W3C Recommendation, December 1999. Available at . [HTTP] Gettys, J., Fielding, R., Mogul, J., Frystyk, H., Masinter, L., Leach, P. and T. Berners-Lee, "Hypertext Transfer Protocol -- HTTP/1.1", RFC 2616, June 1999. [I18N] Yergeau, F., Nicol, G. and M. Duerst, "Internationalization of the Hypertext Markup Language", RFC 2070, January 1997. [MHTML] Palme, J., Hotmann, A. and N. Shelness, "MIME Encapsulation of Aggregate Documents, such as HTML (MHTML)", RFC 2557, March 1999. [MIME] Freed, N. and N. Borenstein, "Multipurpose Internet Mail Extensions (MIME) Part Two: Media Types", RFC 2046, November 1996. [TABLES] Raggett, D., "HTML Tables", RFC 1942, May 1996. [UPLOAD] Nebel, E. and L. Masinter, "Form-based File Upload in HTML", RFC 1867, November 1995. [URI] Berners-Lee, T., Fielding, R. and L. Masinter, "Uniform Resource Identifiers (URI): Generic Syntax", RFC 2396, August 1998. [XHTML1] "XHTML 1.0: The Extensible HyperText Markup Language: A Reformulation of HTML 4 in XML 1.0", W3C Recommendation, January 2000. Available at . Connolly & Masinter Informational [Page 7] RFC 2854 The 'text/html' Media Type June 2000 10. Dichiarazione Completa di Copyright Copyright (C) The Internet Society (2000). All Rights Reserved. This document and translations of it may be copied and furnished to others, and derivative works that comment on or otherwise explain it or assist in its implementation may be prepared, copied, published and distributed, in whole or in part, without restriction of any kind, provided that the above copyright notice and this paragraph are included on all such copies and derivative works. However, this document itself may not be modified in any way, such as by removing the copyright notice or references to the Internet Society or other Internet organizations, except as needed for the purpose of developing Internet standards in which case the procedures for copyrights defined in the Internet Standards process must be followed, or as required to translate it into languages other than English. The limited permissions granted above are perpetual and will not be revoked by the Internet Society or its successors or assigns. This document and the information contained herein is provided on an "AS IS" basis and THE INTERNET SOCIETY AND THE INTERNET ENGINEERING TASK FORCE DISCLAIMS ALL WARRANTIES, EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO ANY WARRANTY THAT THE USE OF THE INFORMATION HEREIN WILL NOT INFRINGE ANY RIGHTS OR ANY IMPLIED WARRANTIES OF MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE. Ringraziamenti Funding for the RFC Editor function is currently provided by the Internet Society. Connolly & Masinter Informational [Page 8]