KORPUS BAHASA

 DEFINISI KORPUS BAHASA

  • Korpus merupakan koleksi data linguistik sama ada dalam bentuk tulisan teks atau transkripsi daripada ucapan atau sebutan yang telah direkodkan.
  • Korpus dilakukan bertujuan untuk mengesahkan sesuatu hipotesis atau andaian yang dibuat dalam penyelidikan yang dilakukan terhadap sesuatu bahasa.
  • Korpus Linguistik pula merupakan kajian bahasa yang dinyatakan dalam sample (corpora) atau perkataan sebenar dalam sesuatu teks.
  • Korpus Linguistik telah menjana beberapa kaedah penyelidikan. Menurut Wallis dan Nelson (2001), mereka menggelarkan kaedah tersebut sebagai perspektif 3A iaitu 'Annotation', 'Abstraction', 'Analysis'. 


Kelebihan korpus Linguistik 

1. Memberi akses kepada maklumat linguistik naturalistik - seperti yang dinyatakan, korpora terdiri daripada 'perkataan yang sebenar' teks yang kebanyakannya sumber daripada situasi kehidupan sebenar. Ini yang menjadikan korpora sumber kajian yang berharga untuk pelbagai bidang. 

2. Memudahkan penyelidikan Linguistik - korpora boleh dibaca secara elektronik dan ini menjimatkan masa pencarian satu-satu perkataan atau frasa.

3. Membolehkan analisis pelbagai parameter pada masa yang sama.

4. Memudahkan kajian bahasa kedua - kajian bahasa kedua dengan penggunaan Bahasa semula jadi membolehkan pelajar untuk mendapatkan konteks sebenar penggunaan satu-satu perkataan atau frasa dan bukannya 'dicipta'. 


Antara korpora Bahasa Inggeris yang terkenal:

1. American National Corpus (ANC)
2. British National Corpus (BNC)
3. The Corpus of American Contemporary (COCA)
4. International Corpus of English (ICE)

Korpora Bahasa Melayu yang terkenal:

1. Korpus DBP
2. Wordsmith UKM-DBP
3. Malay Concordance Project (MCP)
4. AntConc



AntConc
  • Diperkenalkan pada tahun 2002. Ketika itu dipanggil KWIC (Key Word in Context) dan hanya digunakan oleh 700 pelajar penulisan saintifik dan teknikal di Universiti Osaka.
  • Merupakan satu perisian yang boleh diprogramkan untuk system Window, Mac OS X dan Linux yang dihasilkan oleh Laurence Anthony, Universiti Waseda, Jepun.
  • Perisian ini berfungsi untuk melihat kekerapan penggunaan kata, frasa dan makna yang terdapat dalam teks dengan lebih mudah dan cepat.
  • Dengan menggunakan perisian AntConc, sesuatu teks itu boleh dianalisis dengan lebih mudah dan seterusnya maklumat yang diperolehi daripada analisis boleh digunakan untuk mengkaji tahap ketinggian kosaa kata orang yang menghasilkan teks tersebut.
  • Perisian ini digunakan untk menganalisis data bagi tujuan penulisan kajian.
  • Ia hanya memerlukan kapasiti memori yang kecil iaitu sebanyak 2MB.
  • Contoh set alat dalam antconc termasuklah "KWIC Concordance", "Search Term Distribution Plot", "Original File View", "Word Clusters/Lexical Bundles", "Word Lists", "Keyword Lists".
  • AntConc boleh dimuat turun secara percuma dengan memuat turun dari halaman di bawah: Laurence Anthony's Software

Rajah 1: Muka depan kaman sesawang Laurence Anthony's Software. 

  • Anda boleh memuat turun AntConc mengikut kesesuaian peranti digital anda
  • Jika laptop anda menggunakan perisian Windows, maka anda boleh memuat turun versi untuk perisian tersebut.


Tatacara penggunaan AntConc

Video 1: Cara menggunakan aplikasi AntConc



Alat yang terdapat dalam AntConc

1. Concordance Tool
  • Alat ini digunakan untuk menunjukkan kata kunci dalam konteks (Key Word in Context) dan membolehkan kita untuk melihat bagaimana sesuatu perkataan atau frasa digunakan dalam korpus teks.
  • Tujuan concordance ialah menganalisis teks . Ia adalah sesuai bagi mereka yang ingin menganalisis teks dengan secara terperinci atau analisis bahasa secara lebih mendalam.
  • Kebolehan concordance juga ialah membuat index dan mendapatkan senarai perkataan perkataan yang diingini . Ia juga boleh membuat ringkasan.
  • Ia boleh membuat perbandingan bagaimana sesuatu perkataan digunakan dalam konteks ayat yang berlainan . Sesuatu perkataan boleh berfungsi sebagai kata nama , kata kerja dan juga kata adjektif. 
2. Concordance Plot Tool
  • Alat yang digunakan untuk menunjukkan hasil carian yang diplotkan dalam format kod bar yang membolehkan kita melihat dimanakah kedudukan hasil carian kita yang dipaparkan dalam teks sasaran kita

3. File View Tool
  • Alat yang berfungsi menunjukkan teks fail individu yang membolehkan kita untuk menyiasat dengan lebih terperinci keputusan yang dihasilkan oleh alat lain AntConc.
4. Clusters
  • Alat ini menunjukkan kelompok yang berdasarkan kepada keadaan carian.
  • Ia meringkaskan keputusan yang dihasilkan oleh concordance tool dan concordance plot tool.
5. Collocates (Kolokasi)
  • Alat yang menunjukkan kolokasi frasa yang dicari yang membolehkan kita menyiasat atau menyelidik pola yang tidak berurutan dalam sesuatu bahasa.
6. Word List (Senarai Perkataan)
  • Alat yang membantu mengira semua perkataan dalam korpus dan memaparkan dalam senarai yang tersusun.
  • Ini membolehkan kita mendapatkan perkataan yang paling kerap guna dalam korpus dalam masa yang singkat.
7. Keyword List (Senarai Kata Kunci)
  • Alat yang digunakan untuk menunjukkan perkataan yang tidak kerap digunakan dalam korpus berbanding dengan perkataan yang terdapat dalam rujukan korpus.
  • Ini membolehkan kita untuk mengenal pasti ciri-ciri perkataan dalam korpus.

Anda boleh tonton video di bawah untuk mengetahui lebih lanjut bagaimana cara menggunakan AntConc untuk menganalisis teks.


Video 2 : Cara menggunakan AntConc untuk menganalisis teks.

Comments