Pada tahun 1960-an, industri komputer dan telekomunikasi yang terus berkembang di Dunia Pertama semakin membutuhkan suatu metode pengodean karakter yang dapat digunakan oleh sistem mana pun dan tidak dipatenkan. Organisasi Internasional untuk Standardisasi (ISO) merangkum susunan alfabet Latin yang umum digunakan oleh publik ke dalam suatu standar pengodean karakter 7-bit (ISO/IEC 646). Standar ini didasarkan pada standar ASCII, yang mencakup susunan karakter 26 × 2 yang digunakan sebagai huruf-huruf dalam alfabet bahasa Inggris. Standar-standar selanjutnya yang dikeluarkan oleh ISO, misalnya ISO/IEC 8859 (pengodean karakter 8-bit) dan ISO/IEC 10646 (Unicode Latin), tetap menggunakan susunan 26 × 2 dalam alfabet bahasa Inggris sebagai susunan alfabet Latin dasar dengan berbagai ekstensi yang mewakili huruf-huruf tambahan yang digunakan dalam bahasa-bahasa lain.[1]
Istilah
"Alfabet Latin Huruf Kapital": huruf-hurufnya dimulai dari U+0041 dan berisi kalimat LATIN CAPITAL LETTER dalam penjelasannya
"Alfabet Latin Huruf Kecil": huruf-huruf dimulai dari U+0061 dan berisi kalimat LATIN SMALL LETTER dalam penjelasannya
Terdapat pula dua susunan huruf lainnya pada blok Bentuk <i>Halfwidth</i> dan <i>Fullwidth</i>:[2]
Huruf kapital: huruf-hurufnya dimulai dari U+FF21 dan berisi kalimat FULLWIDTH LATIN CAPITAL LETTER dalam penjelasannya
Huruf kecil: huruf-hurufnya dimulai dari U+FF41 dan berisi kalimat FULLWIDTH LATIN SMALL LETTER dalam penjelasannya
Garis waktu standar pengodean
Kode Morse Internasional dibakukan pada tahun 1865 dalam Kongres Telegrafi Internasional di Paris, dan kemudian dijadikan standar oleh International Telecommunication Union (ITU)
1963/1964: EBCDIC (dikembangkan oleh IBM dan mendukung karakter alfabet yang sama dengan ASCII, tetapi dengan nilai kode berbeda)
30 Aoril 1965: Diratifikasi oleh ECMA sebagai ECMA-6[4] berdasarkan pekerjaan yang dilakukan Komite Teknis ECMA TC1 sejak Desember 1960.[4]
1972: ISO 646 (standar pengodean karakter ISO 7-bit, menggunakan nilai kode alfabet yang sama dengan ASCII, yang direvisi dalam ISO 646:1983 edisi kedua, serta dalam ISO/IEC 646:1991 edisi ketiga sebagai standar gabungan ISO/IEC)
1987: ISO/IEC 8859-1:1987 (pengkodean karakter 8-bit)
Sesudah itu, berbagai versi dan bagian lain dari ISO/IEC 8859 telah diterbitkan.
Pertengahan hingga akhir 1980-an: Windows-1250, Windows-1252, dan pengodean lain yang digunakan di Microsoft Windows (beberapa pengodean kira-kira mirip dengan ISO/IEC 8859-1)
1990: Unicode 1.0 (dikembangkan oleh Unicode Consortium),[5][6] yang termasuk dalam blok "Kontrol C0 dan Alfabet Latin Dasar" menggunakan nilai kode alfabet yang sama dengan ASCII dan ISO/IEC 646
Setelah itu, versi Unicode lainnya telah diterbitkan dan kemudian menjadi standar gabungan ISO/IEC, seperti yang disebutkan di bawah ini.
1993: ISO/IEC 10646-1:1993, standar ISO/IEC untuk karakter dalam Unicode 1.1
Setelah itu, versi lain dari ISO/IEC 10646-1 dan salah satu versi dari ISO/IEC 10646-2 telah diterbitkan. Sejak tahun 2003, standar tersebut diterbitkan dengan nama "ISO/IEC 10646" tanpa pemisahan menjadi dua bagian.
1997: Windows Glyph List 4
Representasi
Dalam pengodean ASCII, huruf-huruf tersebut termasuk dalam karakter yang dapat dicetak, sementara dalam Unicode, sejak versi 1.0, huruf-huruf tersebut dimasukkan dalam blok "Kontrol C0 dan Alfabet Latin Dasar". Dalam kedua pengodean tersebut, serta dalam ISO/IEC 646, ISO/IEC 8859, dan ISO/IEC 10646, huruf-huruf tersebut menempati posisi dalam notasi heksadesimal 41 hingga 5A untuk huruf besar dan 61 hingga 7A untuk huruf kecil.
Semua huruf kecil digunakan dalam Alfabet Fonetik Internasional (IPA). Pada sistem X-SAMPA dan SAMPA, huruf-huruf ini memiliki nilai bunyi yang sama seperti pada IPA.
Alfabet yang mengandung susunan huruf yang sama
Daftar di bawah ini mencakup susunan alfabet dari bahasa-bahasa tertentu yang tidak memiliki:
huruf bertanda diakritik yang lafalnya berbeda dengan huruf aslinya, sehingga menjadikannya huruf yang berbeda.
susunan huruf multigraf yang dianggap sebagai huruf yang berbeda.
ligatur yang ditetapkan sebagai huruf yang berbeda
Pengecualian yang patut dicatat karena tidak terkait oleh peraturan di atas mencakup bahasa Spanyol, Esperanto, Filipino, dan Jerman. Berdasarkan tradisi, alfabet bahasa Jerman kadang-kadang dianggap hanya terdiri dari 26 huruf; huruf ä, ö, dan ü dianggap sebagai varian dan huruf ß dianggap sebagai ligatur. Namun, aturan ortografi Jerman saat ini memasukkan huruf ä, ö, ü, ß ke dalam dalam alfabet yang ditempatkan setelah huruf Z. Meskipun demikian, susunan ini biasanya tidak digunakan dalam menyusun urutan alfabetis, karena huruf ä, ö, ü biasanya dianggap sebagai a, o, u (atau terkadang sebagai ae, oe, ue), sementara ß sebagai ss.
Alfabet
Diakritik
Multigraf (yang tidak dianggap sebagai huruf berbeda)
Digraf ⟨ij⟩ terkadang dianggap sebagai huruf yang berbeda. Jika demikan, digraf tersebut biasanya menggantikan atau digunaan bersamaan dengan huruf ⟨y⟩. Digraf lainnya: ⟨aa⟩, ⟨ae⟩, ⟨ai⟩, ⟨au⟩, ⟨ch⟩, ⟨ee⟩, ⟨ei⟩, ⟨eu⟩, ⟨ie⟩, ⟨oe⟩, ⟨oi⟩, ⟨oo⟩, ⟨ou⟩, ⟨ui⟩, ⟨uu⟩
Bahasa Inggris adalah salah satu dari sedikit bahasa Eropa modern yang tidak memerlukan diakritik untuk kata-kata aslinya (walaupun tanda diaresis terkadang digunakan oleh beberapa penerbit AS untuk kata-kata seperti "coöperation").[c][8]
Interlingua sebagai bahasa buatan tidak pernah menggunakan diakritik kecuali dalam kata-kata serapan yang belum disesuaikan. Namun, diakritik tersebut dapat dihilangkan jika tidak digunakan untuk memodifikasi vokal (misalnya cafe, dari bahasa Prancis: café).[9]
Bahasa Latin tanpa fleksi, alias "Interlingua Peano", mengizinkan tetapi tidak mengharuskan penggunaan aksen untuk penekanan-penekanan takbiasa. (Bentuk ini mendahului "Interlingua" lainnya sekitar empat dekade.)
Bahasa Indonesia dan bahasa Melayu adalah satu-satunya bahasa di luar Eropa yang menggunakan semua alfabet Latin dan tidak memerlukan diakritik dan ligatur.[d] Sebagian besar bahasa-bahasa daerah di Indonesia (yang berjumlah sekitar 700-an lebih) juga menggunakan alfabet Indonesia untuk menulis bahasa mereka, dan beberapa—seperti bahasa Jawa—menambahkan diakritik é dan è, dan beberapa menghilangkan huruf q, x, dan z.
Penomoran kolom
Alfabet Romawi (Latin) biasanya digunakan untuk penomoran kolom dalam tabel atau bagan. Hal tersebut dilakukan untuk menghindari kebingungan dengan nomor baris yang menggunakan angka Arab. Misalnya, tabel 3-kali-3 akan berisi kolom A, B, dan C serta baris 1, 2, dan 3. Jika diperlukan lebih banyak kolom selain Z (huruf terakhir alfabet Latin), kolom setelah Z umumnya ditulis AA, yang diikuti oleh AB, dan seterusnya (lihat sistem bijektif basis-26). Sistem penomoran seperti ini dapat dilihat dengan menggulir jauh ke kanan pada program lembar sebar seperti Microsoft Excel atau LibreOffice Calc.
Sistem tersebut merupakan "huruf" dua digit yang digunakan untuk kolom tabel, sama seperti 10 hingga 99 adalah angka dua digit. Alfabet Yunani mempunyai bentuk perluasan yang serupa yang menggunakan huruf dua digit jika diperlukan, tetapi digunakan untuk asrama persaudaraan dan bukan untuk kolom tabel.
Huruf dua digit untuk daftar berpoin adalah AA, BB, CC, dll., berbeda dengan sistem nilai tempat dengan angka seperti yang dijelaskan di atas untuk kolom tabel.
^Alfabet bahasa Italia secara tradisional hanya mencakup 21 huruf, sehingga huruf j, k, w, x, y dianggap tidak termasuk ortografi. Namun dalam praktiknya, huruf-huruf tersebut muncul pada sejumlah kata-kata serapan. J juga muncul pada beberapa nama diri Italia asli sebagai varian dari huruf semivokal i.
^Catatan untuk bahasa Portugis:
Huruf k dan y (tetapi bukan huruf w) awalnya termasuk dalam alfabet bahasa Portugis hingga munculnya pembaruan ejaan pada abad ke-20 dengan tujuan mengubah ejaan kata-kata bahasa Portugis etimologis menjadi lebih sesuai dengan ejaan fonemnya. Huruf-huruf berikut digantikan oleh huruf-huruf lain yang memiliki bunyi yang sama, sehingga psychologia menjadi psicologia, kioske menjadi quiosque, martyr menjadi mártir, dll. Saat ini huruf k, w, dan y hanya dapat dijumpai pada kata-kata asing dan turunannya serta dalam singkatan-singkatan ilmiah (mis. km, byronismo). Ketiga huruf tersebut dianggap sebagai bagian dari alfabet bahasa Portugis melalui Perjanjian Ortografi Bahasa Portugis 1990, yang mulai berlaku sejak tanggal 1 Januari 2009 di Brasil.
^Namun, materi pembelajaran untuk bahasa Indonesia dan bahasa Melayu mungkin saja menggunakan huruf E berdiakritik untuk memperjelas lafal /ə/ dan /e/ yang sama-sama dilambangkan dengan huruf E.
^"The Postal History of ICAO". www.icao.int. Diarsipkan dari versi asli tanggal February 12, 2019. Diakses tanggal 2019-02-17.Parameter |url-status= yang tidak diketahui akan diabaikan (bantuan)
^ abStandard ECMA-6: 7-Bit Coded Character Set(PDF) (edisi ke-5th). Geneva, Switzerland: European Computer Manufacturers Association (Ecma). March 1985. Diarsipkan dari versi asli(PDF) tanggal May 29, 2016. Diakses tanggal 2016-05-29. The Technical Committee TC1 of ECMA met for the first time in December 1960 to prepare standard codes for Input/Output purposes. On April 30, 1965, Standard ECMA-6 was adopted by the General Assembly of ECMA.Parameter |url-status= yang tidak diketahui akan diabaikan (bantuan)