ISO 639-3: differenze tra le versioni

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca
Contenuto cancellato Contenuto aggiunto
Nessun oggetto della modifica
(21 versioni intermedie di 15 utenti non mostrate)
Riga 1: Riga 1:
'''ISO 639-3:2007,''' '''Codici per la rappresentazione dei nomi delle lingue - Parte 3: Codice Alpha-3 per una copertura completa delle lingue''', è la terza parte dello [[Organizzazione internazionale per la normazione|''standard'' internazionale]] per i codici delle lingue della serie [[ISO 639]], un sistema elaborato per classificare tutti i [[Linguaggio|linguaggi]], tra cui anche tutte le [[Lingua (linguistica)|lingue parlate]] del mondo, associando a ciascun linguaggio un codice identificativo unico. Lo standard è stato pubblicato dall'[[Organizzazione internazionale per la normazione|Organizzazione Internazionale per la normazione]] (ISO) il 1º febbraio 2007<ref>{{Cita web|url=https://www.iso.org/cms/render/live/en/sites/isoorg/contents/data/standard/03/95/39534.html|titolo=ISO 639-3:2007|autore=14:00-17:00|sito=ISO|lingua=en|accesso=2022-05-04}}</ref>.
'''ISO 639-3''' è la terza parte dello [[International Organization for Standardization|standard internazionale]] [[ISO 639]], che specifica un codice identificativo unico per ciascuna delle diverse lingue parlate nel mondo.


La terza sezione dell'ISO 639 è un indice che assegna codici di 3 lettere (''alpha-3'') a un vasto catalogo di linguaggi tra cui lingue moderne, antiche, estinte e persino artificiali, includendo anche dialetti e lingue riservate, per un totale di 7776 elementi. L'obiettivo è costruire un indice generale e il più dettagliato possibile che includa qualunque tipo di [[Linguaggio|linguaggio naturale]] umano parlato nel mondo. La copertura linguistica estesa è stata basata principalmente sui codici linguistici utilizzati nell'[[Ethnologue]] (volumi 10-14) pubblicato da [[SIL International]], che è ora l'ufficio di registrazione per ISO 639-3<ref>{{Cita web|url=https://www.iso.org/maintenance_agencies.html|titolo=ISO - Maintenance agencies and registration authorities|sito=ISO|lingua=en|accesso=2022-05-04}}</ref>.
La versione pubblicata nel 2007 è la [http://www.iso.org/iso/catalogue_detail?csnumber=39534 ISO 639-3:2007]: ''Codici per la rappresentazione dei nomi delle lingue -- Parte 3: Alpha-3 code'' ''for comprehensive coverage of languages''. L'obiettivo è quello di costruire un indice generale e il più dettagliato possibile, che fornisca un codice identificativo per qualunque tipo di [[linguaggio naturale]] umano parlato nel mondo.
L'indice ISO 639-3 assegna codici di 3 lettere (''alpha-3'') a un vasto catalogo di lingue moderne, antiche, estinte e persino artificiali, per un totale di 7776 elementi.


Questo nuovo codice perfeziona il lavoro fatto con la precedente versione [[ISO 639-2]], completando e rettificandone la classificazione. L'ISO 639-3 è progettato per non entrare in conflitto con l'ISO 639-2 (per questo, tutti gli elementi presenti nell'ISO 639-2 sono dotati di un nuovo codice identificativo - ad eccezione delle [[Famiglia linguistica|famiglie linguistiche]] o collezioni di linguaggi, escluse dall'ISO 639-3 e reintrodotte solo nel più tardo ISO 693-5). Le combinazioni consentite dalla scelta di una codifica fatta di 3 lettere (''alpha-3''), permette di classificare un insieme vastissimo di linguaggi.
Si tratta di un codice a tre lettere che perfeziona il lavoro fatto con la precedente versione [[ISO 639-2]], completando e rettificandone la classificazione.
L'ISO 639-3 è progettato per non entrare in conflitto con l'ISO 639-2 (per questo, tutti gli elementi presenti nell'ISO 639-2 sono dotati di un nuovo codice identificativo - ad eccezione delle [[Famiglia linguistica|famiglie linguistiche]], escluse dall'ISO 639-3 e reintrodotte solo nel più tardo ISO 693-5).


Originariamente erano previsti l'aggiornamento e la verifica annuale dei codici così redatti, al fine di affinare ulteriormente il lavoro di classificazione fatto.
Originariamente erano previsti l'aggiornamento e la verifica annuale dei codici così redatti, al fine di affinare ulteriormente il lavoro di classificazione fatto.


==Sintassi della codifica==
== Sintassi della codifica ==
{{vedi anche|Codici ISO 639-3}}
{{vedi anche|Codici ISO 639-3}}
Alle lingue viene assegnato un codice di tre lettere seguito opzionalmente da due lettere che identificano rispettivamente il '''dominio (scope)''' e il '''tipo (type)'''.
Ai linguaggi viene assegnato un codice di tre lettere seguito opzionalmente da due lettere che identificano rispettivamente l''''ambito (scope)''' e il '''tipo (type)'''.


===Dominio (scope)===
=== Ambito (scope) ===
*'''individual (I)''' lingua a stante, indipendente
* '''individual (I)''' linguaggio a se stante, indipendente
*'''macrolanguage (M)''' lingua che genera sottotipi evoluti
* '''macrolanguage (M)''' linguaggio che genera sottotipi evoluti
*'''collections''' gruppo di lingue strettamente imparentate tra loro
* '''collections''' gruppo di linguaggi strettamente imparentati tra loro
*'''reserved''' riservato a codifiche locali (da '''qaa''' a '''qtz''')
* '''reserved''' riservato per uso locale (da '''qaa''' a '''qtz''')
*'''specials (S)''' riservato a situazioni indeterminate o multiple ('''und''', '''mul''' e '''zxx''')
* '''specials (S)''' riservato a situazioni indeterminate o multiple ('''und''', '''mul''' e '''zxx''')
*'''dialects''' sottotipo derivante da altra lingua
* '''dialects''' versione derivante da un altro linguaggio
''da notare che nessun dialetto (termine -dialetto- come inteso in italiano) può essere incluso nello standard ISO 639-3, l'accezione -dialects- indica un sottotipo e discrimina unicamente una lingua vera e propria generata ed evolutasi a partire da una lingua matrice''


''da notare che l'accezione -dialects- indica una variante linguistica e ISO applica alcuni criteri per identificare queste varianti che, tuttavia, non sono basati solo su criteri linguistici<ref name="ethnologue.com">[https://www.ethnologue.com/about/problem-language-identification Ethnologue -The Problem of Language Identification]</ref>. Infatti sono state mosse diverse critiche a ISO proprio nel caso di definizione di linguaggi da includere come dialetti<ref name="ethnologue.com" /><ref>S.Morey, M.Post, V.Friedman, The language codes of ISO 639: [prijipati.library.usyd.edu.au/handle/2123/9838 A premature, ultimately unobtainable, and possibly damaging standardization]. PARADISEC RRR Conference, 2013</ref>. Ad ogni modo occorre considerare che l'inclusione nell'ISO 693-3 non differenzia tra lingue o dialetti, più che altro la presenza nell'ISO 693-3 indica se un dialetto è una variante linguistica abbastanza definita per poter avere un proprio codice invece che essere aggregato in un altro linguaggio.''
===Tipo (type)===

*'''living (L)''' lingua attiva, usata come lingua madre da qualcuno in vita.
=== Tipo (type) ===
*'''extinct (E)''' lingua estinta, non più utilizzata
*'''ancient (A)''' lingua molto documentata ma estinta in tempi remoti
* '''living (L)''' lingua attiva, usata come lingua madre da qualcuno in vita.
*'''historical (H)''' lingua dalla quale in tempi storici è derivata una o più lingue
* '''extinct (E)''' lingua estinta, non più utilizzata
*'''constructed (C)''' lingua artificiale
* '''ancient (A)''' lingua molto documentata ma estinta in tempi remoti
* '''historical (H)''' lingua dalla quale in tempi storici sono derivate una o più lingue
* '''constructed (C)''' lingua artificiale
''da notare che per lingua -ancient- viene utilizzato un criterio di letteratura, scolarità e comunità parlante mentre per lingua -extinct- basta il criterio di intelligibilità''
''da notare che per lingua -ancient- viene utilizzato un criterio di letteratura, scolarità e comunità parlante mentre per lingua -extinct- basta il criterio di intelligibilità''


===Novità rispetto agli ISO 639-2 e ISO 639-1===
=== Novità rispetto agli ISO 639-2 e ISO 639-1 ===
L'ISO 639-3 rappresenta un tentativo di costruzione di un indice delle lingue assai più dettagliato, che come i precedenti tiene conto della letteratura prodotta nelle varie lingue, ma si differenzia nel cercare di rendere conto in maniera più articolata della situazione concreta delle lingue parlate. Le principali caratteristiche dell'ISO 639-3 sono:
L'ISO 639-3 rappresenta un tentativo di costruzione di un indice delle lingue assai più dettagliato, che come i precedenti tiene conto della letteratura prodotta nelle varie lingue, ma si differenzia nel cercare di rendere conto in maniera più articolata della situazione concreta delle lingue parlate. Le principali caratteristiche dell'ISO 639-3 sono:
*L'inserimento nell'indice di molte più [[macrolinguaggio|macrolingue]]. Questo comprende sia nuovi elementi, che elementi già codificati in precedenza. Nello specifico, vi sono 56 elementi che nell'ISO 639-2 erano catalogati come lingua, e che nell'ISO 639-3 sono stati invece catalogati come macrolingua. Ciò fa sì che in determinati contesti un linguaggio, che in precedenza veniva considerati come semplice "dialetti" di una lingua ISO 639-2, secondo lo standard ISO 639-3 può esser considerato una lingua a sé stante.
* L'inserimento nell'indice di molte più [[macrolinguaggio|macrolingue]]. Questo comprende sia nuovi elementi, che elementi già codificati in precedenza. Nello specifico, vi sono 56 elementi che nell'ISO 639-2 erano catalogati come lingua, e che nell'ISO 639-3 sono stati invece catalogati come macrolingua. Ciò fa sì che in determinati contesti un linguaggio, che in precedenza veniva considerato come semplice "dialetto" di una lingua ISO 639-2, secondo lo standard ISO 639-3 può esser considerato una lingua a sé stante.
*La differenza di trattamento riservata alle [[famiglie linguistiche]], una cui prima indicizzazione era stata già intrapresa con l'ISO 639-2. Questi elementi sono stati totalmente esclusi dall'ISO 639-3, che si concentra esclusivamente su lingue e macrolingue. Le famiglie linguistiche sono re-indicizzate solo con il successivo ISO 639-5.
* La differenza di trattamento riservata alle [[famiglie linguistiche]], una cui prima indicizzazione era stata già intrapresa con l'ISO 639-2. Questi elementi sono stati totalmente esclusi dall'ISO 639-3, che si concentra esclusivamente su lingue e macrolingue. Le famiglie linguistiche sono re-indicizzate solo con il successivo ISO 639-5.


====esempio di ricodifica====
==== Esempio di ricodifica ====
* ISO 639-1: codici di 2 lettere corrispondenti alla prima generale classificazione delle lingue parlate e scritte del pianeta (codici come {{IT}}, {{DE}}, {{FR}}, eccetera).
* ISO 639-1: codici di 2 lettere corrispondenti alla prima generale classificazione delle lingue parlate e scritte del pianeta (codici come {{It}}, {{De}}, {{Fr}}, eccetera).
* ISO 639-2: codici di 3 lettere corrispondenti a un primo tentativo di classificare lingue e famiglie linguistiche. Per la maggiorparte superato dallo standard 639-3, sebbene sia stato largamente impliegato dai sistemi bibliografici (biblioteche).
* ISO 639-2: codici di 3 lettere corrispondenti a un primo tentativo di classificare lingue e famiglie linguistiche. Per la maggior parte superato dallo standard 639-3, sebbene sia stato largamente impiegato dai sistemi bibliografici (biblioteche).


{| class="wikitable"
{| class="wikitable"
Riga 51: Riga 50:
|a sé stante||arb + altri
|a sé stante||arb + altri
|-
|-
|[[Lingua cinese]]|| rowspan="4" |zh|| rowspan="4" |chi/zho<ref name="ethnologue">[http://archive.ethnologue.com/14/show_iso639.asp?code=zho report del sito ''Ethnologue'' per il codice ISO 639 "zho"] su ethnologue.com</ref><ref>[http://www-01.sil.org/iso639-3/macrolanguages.asp ISO639-3] su SIL.org</ref>||macrolingua||zho
|[[Lingua cinese]]|| rowspan="4" |zh|| rowspan="4" |chi/zho<ref name="ethnologue">[http://archive.ethnologue.com/14/show_iso639.asp?code=zho report del sito ''Ethnologue'' per il codice ISO 639 "zho"] {{webarchive|url=https://web.archive.org/web/20140912140028/http://archive.ethnologue.com/14/show_iso639.asp?code=zho |data=12 settembre 2014 }} su ethnologue.com</ref><ref>[http://www-01.sil.org/iso639-3/macrolanguages.asp ISO639-3] su SIL.org</ref>||macrolingua||zho
|-
|-
|[[Cinese mandarino (varietà linguistica)|Mandarino]]||a sé stante||cmn
|[[Cinese mandarino (varietà linguistica)|Mandarino]]||a sé stante||cmn
|-
|-
|[[Cantonese]]||a sé stante||yue
|[[Lingua cantonese|Cantonese]]||a sé stante||yue
|-
|-
|[[Min Nan]]||a sé stante||nan
|[[Lingua min nan|Min nan]]||a sé stante||nan
|}
|}


==Bibliografia==
== Note ==
<references />

== Bibliografia ==
* [http://www.iso.org/iso/catalogue_detail?csnumber=39534 ISO 639-3:2007] pagina ufficiale
* [http://www.iso.org/iso/catalogue_detail?csnumber=39534 ISO 639-3:2007] pagina ufficiale
* Homepage non ufficiale dello standard ISO 639-3 [http://www-01.sil.org/iso639-3/default.asp SIL]
* Homepage non ufficiale dello standard ISO 639-3 [http://www-01.sil.org/iso639-3/default.asp SIL]
== Voci correlate ==
{{Standard ISO}}[[Categoria:Standard ISO]]
* [[ISO 639]]

{{Standard ISO}}

[[Categoria:Lingue]]
[[Categoria:Standard ISO]]

{{portale|linguistica}}
{{portale|linguistica}}

Versione delle 00:40, 14 dic 2022

ISO 639-3:2007, Codici per la rappresentazione dei nomi delle lingue - Parte 3: Codice Alpha-3 per una copertura completa delle lingue, è la terza parte dello standard internazionale per i codici delle lingue della serie ISO 639, un sistema elaborato per classificare tutti i linguaggi, tra cui anche tutte le lingue parlate del mondo, associando a ciascun linguaggio un codice identificativo unico. Lo standard è stato pubblicato dall'Organizzazione Internazionale per la normazione (ISO) il 1º febbraio 2007[1].

La terza sezione dell'ISO 639 è un indice che assegna codici di 3 lettere (alpha-3) a un vasto catalogo di linguaggi tra cui lingue moderne, antiche, estinte e persino artificiali, includendo anche dialetti e lingue riservate, per un totale di 7776 elementi. L'obiettivo è costruire un indice generale e il più dettagliato possibile che includa qualunque tipo di linguaggio naturale umano parlato nel mondo. La copertura linguistica estesa è stata basata principalmente sui codici linguistici utilizzati nell'Ethnologue (volumi 10-14) pubblicato da SIL International, che è ora l'ufficio di registrazione per ISO 639-3[2].

Questo nuovo codice perfeziona il lavoro fatto con la precedente versione ISO 639-2, completando e rettificandone la classificazione. L'ISO 639-3 è progettato per non entrare in conflitto con l'ISO 639-2 (per questo, tutti gli elementi presenti nell'ISO 639-2 sono dotati di un nuovo codice identificativo - ad eccezione delle famiglie linguistiche o collezioni di linguaggi, escluse dall'ISO 639-3 e reintrodotte solo nel più tardo ISO 693-5). Le combinazioni consentite dalla scelta di una codifica fatta di 3 lettere (alpha-3), permette di classificare un insieme vastissimo di linguaggi.

Originariamente erano previsti l'aggiornamento e la verifica annuale dei codici così redatti, al fine di affinare ulteriormente il lavoro di classificazione fatto.

Sintassi della codifica

Lo stesso argomento in dettaglio: Codici ISO 639-3.

Ai linguaggi viene assegnato un codice di tre lettere seguito opzionalmente da due lettere che identificano rispettivamente l'ambito (scope) e il tipo (type).

Ambito (scope)

  • individual (I) linguaggio a se stante, indipendente
  • macrolanguage (M) linguaggio che genera sottotipi evoluti
  • collections gruppo di linguaggi strettamente imparentati tra loro
  • reserved riservato per uso locale (da qaa a qtz)
  • specials (S) riservato a situazioni indeterminate o multiple (und, mul e zxx)
  • dialects versione derivante da un altro linguaggio

da notare che l'accezione -dialects- indica una variante linguistica e ISO applica alcuni criteri per identificare queste varianti che, tuttavia, non sono basati solo su criteri linguistici[3]. Infatti sono state mosse diverse critiche a ISO proprio nel caso di definizione di linguaggi da includere come dialetti[3][4]. Ad ogni modo occorre considerare che l'inclusione nell'ISO 693-3 non differenzia tra lingue o dialetti, più che altro la presenza nell'ISO 693-3 indica se un dialetto è una variante linguistica abbastanza definita per poter avere un proprio codice invece che essere aggregato in un altro linguaggio.

Tipo (type)

  • living (L) lingua attiva, usata come lingua madre da qualcuno in vita.
  • extinct (E) lingua estinta, non più utilizzata
  • ancient (A) lingua molto documentata ma estinta in tempi remoti
  • historical (H) lingua dalla quale in tempi storici sono derivate una o più lingue
  • constructed (C) lingua artificiale

da notare che per lingua -ancient- viene utilizzato un criterio di letteratura, scolarità e comunità parlante mentre per lingua -extinct- basta il criterio di intelligibilità

Novità rispetto agli ISO 639-2 e ISO 639-1

L'ISO 639-3 rappresenta un tentativo di costruzione di un indice delle lingue assai più dettagliato, che come i precedenti tiene conto della letteratura prodotta nelle varie lingue, ma si differenzia nel cercare di rendere conto in maniera più articolata della situazione concreta delle lingue parlate. Le principali caratteristiche dell'ISO 639-3 sono:

  • L'inserimento nell'indice di molte più macrolingue. Questo comprende sia nuovi elementi, che elementi già codificati in precedenza. Nello specifico, vi sono 56 elementi che nell'ISO 639-2 erano catalogati come lingua, e che nell'ISO 639-3 sono stati invece catalogati come macrolingua. Ciò fa sì che in determinati contesti un linguaggio, che in precedenza veniva considerato come semplice "dialetto" di una lingua ISO 639-2, secondo lo standard ISO 639-3 può esser considerato una lingua a sé stante.
  • La differenza di trattamento riservata alle famiglie linguistiche, una cui prima indicizzazione era stata già intrapresa con l'ISO 639-2. Questi elementi sono stati totalmente esclusi dall'ISO 639-3, che si concentra esclusivamente su lingue e macrolingue. Le famiglie linguistiche sono re-indicizzate solo con il successivo ISO 639-5.

Esempio di ricodifica

  • ISO 639-1: codici di 2 lettere corrispondenti alla prima generale classificazione delle lingue parlate e scritte del pianeta (codici come (IT) , (DE) , (FR) , eccetera).
  • ISO 639-2: codici di 3 lettere corrispondenti a un primo tentativo di classificare lingue e famiglie linguistiche. Per la maggior parte superato dallo standard 639-3, sebbene sia stato largamente impiegato dai sistemi bibliografici (biblioteche).
lingua codice
639-1
codice
639-2
Dominio
639-3
codice
639-3
Inglese en eng a sé stante eng
Tedesco de ger/deu a sé stante deu
Arabo ar ara macrolingua ara
a sé stante arb + altri
Lingua cinese zh chi/zho[5][6] macrolingua zho
Mandarino a sé stante cmn
Cantonese a sé stante yue
Min nan a sé stante nan

Note

  1. ^ (EN) 14:00-17:00, ISO 639-3:2007, su ISO. URL consultato il 4 maggio 2022.
  2. ^ (EN) ISO - Maintenance agencies and registration authorities, su ISO. URL consultato il 4 maggio 2022.
  3. ^ a b Ethnologue -The Problem of Language Identification
  4. ^ S.Morey, M.Post, V.Friedman, The language codes of ISO 639: [prijipati.library.usyd.edu.au/handle/2123/9838 A premature, ultimately unobtainable, and possibly damaging standardization]. PARADISEC RRR Conference, 2013
  5. ^ report del sito Ethnologue per il codice ISO 639 "zho" Archiviato il 12 settembre 2014 in Internet Archive. su ethnologue.com
  6. ^ ISO639-3 su SIL.org

Bibliografia

Voci correlate

  Portale Linguistica: accedi alle voci di Wikipedia che trattano di linguistica