Metode linear kongruen

Metode linear kongruen (Inggris: linear congruent method, dapat disingkat dengan LCM) merupakan algoritma yang menghasilkan barisan bilangan acak semu lewat persamaan linear bagian-demi-bagian. Metode ini juga dikenal dengan metode kongruen linear, pembangkit kongruensial linear dan generator kongruensial linear (Inggris: linear congruential generator, LCG). Metode ini termasuk algoritma yang tertua dan terkenal untuk membangkitkan bilangan acak semu.^[1] Konsep metode ini relatif mudah dipahami, mudah diimplementasikan, dan memiliki waktu eksekusi yang cepat, khususnya untuk perangkat keras komputer yang mendukung aritmetika modular dengan pemotongan pada bit-bit penyimpanan. LCM memanfaatkan relasi rekursif linear:

$X_{n+1}=\left(aX_{n}+c\right)~~{\bmod {~}}~m$

dengan $X$ sebagai barisan bilangan acak semu, dan konstanta bilangan bulat

m

positif sebagai "modulus"

a

dengan

0<a<m

sebagai "pengali"

c

dengan

0\leq c<m

sebagai "penambah"; dan

X_{0}

dengan

0\leq X_{0}<m

sebagai "benih", "nilai awal", atau "kondisi awal"

sebagai parameter khas untuk LCM. Jika $c=0$ , metode ini umum disebut degan metode kongruensial multiplikatif (Inggris: multiplicative congruential generator, MCG) atau pembangkit Lehmer. Jika $c\neq 0$ , metode ini disebut metode kongruensial campuran.^[2] Ketika $c\neq 0$ , relasi rekursif LCM sebenarnya adalah sebuah transformasi affine, bukan transformasi linear. Namun penggunaan istilah linear yang salah sudah sangat umum pada bidang ilmu komputer.^[3]

Demonstrasi

Terdapat 50 soal pada sebuah sistem database ujian. Untuk setiap ujian, $5$ soal akan dipilih secara acak dari database. Untuk mengusahakan tidak terjadi repetisi soal-soal yang telah dikerjakan, sistem memilih soal "baru" dengan menggunakan LCM; dengan konstanta $a=11$ , $c=7$ , $m=50$ , dan $X_{0}=1$ . Berikut adalah lima bilangan acak (semu) pertama yang dihasilkan oleh LCM tersebut

$X_{1}=(11(1)+7)\ \ {\text{mod}}\ \ 50=18$
$X_{2}=(11(18)+7)\ \ {\text{mod}}\ \ 50=5$
$X_{3}=(11(5)+7)\ \ {\text{mod}}\ \ 50=12$
$X_{4}=(11(12)+7)\ \ {\text{mod}}\ \ 50=39$
$X_{5}=(11(39)+7)\ \ {\text{mod}}\ \ 50=36$

Lebih lanjut, barisan 20 bilangan acak pertama yang dibangkitkan adalah: 18, 5, 12, 39, 36, 3, 40, 47, 24, 21, 38, 25, 32, 9, 6, 23, 10, 17, 44, 42.

Pemilihan nilai konstanta pada $a$ , $c$ , dan $m$ pada LCM ini sesuai untuk menghindari perulangan soal pada saat melakukan ujian. Saat melakukan ujian pertama kali, nilai $X_{1}$ dan peserta akan mendapatkan soal bernomor {18, 5, 12, 39, 36}. Namun ujian yang kedua memiliki nilai awal $X_{6}$ dan peserta akan mendapatkan soal bernomor {3, 40, 47, 24, 21}.

Sejarah

Metode pembangkit Lehmer dipublikasikan pada tahun 1951,^[4] dan the Metode linear kongruen dipublikasikan pada tahun 1958 oleh W. E. Thomson and A. Rotenberg.^[5]^[6]

Panjang periode

Ciri dari LCM adalah akan terjadi pengulangan hasil setelah sekian kali pembangkitan. Dengan pemilihan parameter yang baik, periode pengulangan dapat diketahui dan dipilih agar lebih lama. Walaupun bukan satu-satunya kriteria, periode yang sangat singkat adalah kesalahan fatal bagi pembangkit bilangan acak semu.^[7]^[8]

Walaupun LCM dapat menghasilkan bilangan acak semu yang lulus uji keacakan, kualitas bilangan yang dihasilkan sangat sensitif terhadap pemilihan parameter $a$ dan $m$ .^[3]^[7]^[9]^[10]^[11]^[12] Sebagai contoh, $a=1$ dan $c=1$ menghasilkan bilangan modulo-m yang terurut, yang walau memiliki periode yang panjang, jelas tidak acak. Secara historis, pemilihan konstanta $a$ yang buruk berujung pada implementasi LCM yang buruk. Contoh khusus kasus ini adalah RANDU, yang digunakan secara luas pada awal 1970-an dan berujung pada banyak hasil yang tidak kredibel.^[13]

Terdapat tiga keluarga parameter yang umum digunakan:

m bilangan prima, c = 0

Ini adalah konstruksi dasar dari pembangkit bilangan acak Lehmer. Periode LCM adalah $m-1$ jika pengali $a$ dipilih sebagai elemen primitif dari modulo $m$ . Kondisi awal perlu dipilih antara $1$ dan $m-1$ .

Kelemahan dari menggunakan modulus bilangan prima adalah operasi modulo memerlukan double-width productdan langkah operasi modulo yang eksplisit. Umumnya prima yang dekat dengan perpangkatan angka 2 ( prima Mersenne yang berbentuk 2³¹−1 dan 2⁶¹−1 populer), sehingga operasi modulo $m=2^{e}-d$ dapat dihitung sebagai

$(ax\ \ {\text{mod}}\ \ 2^{e})+d{\Big \lfloor }{\frac {ax}{2^{e}}}{\Big \rfloor }$

Hal ini perlu diikuti oleh pengurangan nilai $m$ jika hasilnya terlalu besar, namun banyaknya pengurangan terbatas oleh $ad/m$ , yang dapat dibatasi dengan mudah menjadi 1 jika nilai $d$ kecil.

Jika double-width product tidak tersedia, namun pengali dipilih secara seksama, metode Schrage^[14] dapat digunakan. Untuk melakukannya:

Faktorkan $m=qa+r$ , misal dengan $q=\lfloor m/a\rfloor$ dan $r=m\ \ {\text{mod}}\ \ a$ .
Hitung nilai $ax\ \ {\text{mod}}\ \ m=a(x\ \ {\text{mod}}\ \ q)-r\lfloor x/q\rfloor$
Karena $x\ \ {\text{mod}}\ \ q<q\leq m/a$ , suku pertama tegas lebih kecil dari $am/a=m$ . Jika $a$ dipilih sehingga $r\leq d$ (sehingga $r/q\leq 1$ ), maka suku kedua juga akan lebih kecil dari $m$ karena $r\lfloor x/q\rfloor \leq rx/q=x(r/q)\leq x<m$ .

Dengan cara ini, untuk menghitung kedua suku cukup digunakan single-width product, dan selisih antara keduanya terletak di $[1-m,\,m-1]$ , sehingga dapat disederhanakan menjadi $[0,\,m-1]$ dengan satu kondisi penjumlahan.^[15]

Kekurangan kedua dari metode ini adalah cukup canggung untuk mengonversi nilai $1\leq x<m$ ke distribusi bit acak yang uniform. Jika sebuah prima yang dekat dengan perpangkatan 2 digunakan, bilangan acak (yang tidak pernah muncul) dapat diabaikan.

m perpangkatan 2, c = 0

Memilih $m$ sebagai perpangkatan dari 2, umumnya $m=2^{32}$ atau $m=2^{64}$ , menghasilkan LCM yang efisien karena hal ini memungkinan operasi modulo dihitung dengan memotong representasi biner bilangan. Faktanya, bit paling signifikan umumnya tidak dihitung sama sekali. Namun, parameter ini memiliki kekurangan.

Bentuk ini memiliki periode maksimum $m/4$ , diperoleh ketika $a\equiv 3\ \ {\text{mod}}\ \ 8$ atau $a\equiv 5\ \ {\text{mod}}\ \ 8$ . Kondisi awal $X_{0}$ perlu bilangan ganjil, dan nilai tiga bit terkecil dari $X$ berseling antara dua nilai sehingga tidak berguna. Dapat ditunjukkan bahwa bentuk ini setara dengan pembangkit dengan modulus $m/4$ dan $c\neq 0$ .^[12]

Isu yang lebih serius karena menggunakan modulus perpangkatan 2 adalah bit-bit rendah memiliki periode yang lebih kecil dibandingkan bit-bit tinggi. Bit terendah dari $X$ tidak pernah berubah (karena selalu bilangan ganjil), dan dua bit selanjutnya berseling antara dua nilai (jika $a\equiv 5\ \ {\text{mod}}\ \ 8$ , nilai bit 1 tidak pernah berubah dan nilai bit 2 berseling, sedangakan jika $a\equiv 3\ \ {\text{mod}}\ \ 8$ nilai bit 1 berseling dan nilai bit 2 selalu tetap).

c ≠ 0

Ketika $c\neq 0$ , pemilihan parameter yang baik memungkinkan periode dapat sepanjang $m$ , untuk semua kondisi awal. Hal ini terjadi, jika dan hanya jika:^[12]

$m$ dan $c$ koprima ,
$a-1$ dapat dibagi semua faktor prima dari $m$ ,
$a-1$ dapat dibagi 4 jika $m$ dapat dibagi 4.

Tiga syarat ini dikenal sebagai Teorema Hull–Dobell.^[16]^[17]

Bentuk ini dapat digunakan untuk sebarang $m$ , namun hanya bekerja dengan baik untuk $m$ yang memiliki banyak faktor prima yang berulang, seperti perpangkatan angka 2. Jika $m$ bilangan bebas-kuadrat, hal ini mengakibatkan $a\equiv 1\ \ {\text{mod}}\ \ m$ , menjadikannya pembangkit bilangan acak yang sangat buruk. Pengali dengan periode maksimum hanya tersedia ketika $m$ memiliki faktor prima yang berulang.

Walau teorema Hull–Dobell memberikan periode yang maksimum, hal tersebut belum cukup untuk membuktikan pembangkit yang baik. Sebagai contoh, $a-1$ yang lebih sulit dibagi oleh faktor-faktor prima $m$ lebih disukai. Karena itu, jika $m$ adalah perpangkatan angka 2, maka $a-1$ perlu dapat dibagi 4 namun tidak dapat dibagi 8, misal $a\equiv 5\ \ {\text{mod}}\ \ 8$ .^[12]

Tentu, kebanyakan pengali menghasilkan barisan yang gagal untuk suatu uji keacakan, dan memilih pengali yang memenuhi semua kriteria uji cukup sulit. Uji spektral adalah salah satu uji keacakan terpenting.

Perhatikan bahwa modulus berupa perpangkatan angka 2 memiliki permasalahan yang sama dengan kasus $c=0$ : $k$ bit terendah menghasilkan pembangkit dengan modulus $2^{k}$ dan karenanya memiliki periode $2^{k}$ ; hanya bit paling signifikan yang memiliki periode penuh. Jika sebuah bilangan acak semu kurang dari $r$ yang diperlukan, menghitung $\lfloor rX/m\rfloor$ memberikan hasil yang lebih baik ketimbang $X\ \ {\text{mod}}\ \ r$ . Sayangnya pada kebanyakan bahasa pemrograman, bentuk terakhir lebih banyak digunakan karena lebih mudah ditulis

Pembangkit LCM sendiri tidak sensitif terhadap pemilihan $c$ , selama nilainya koprima terhadap modulus (misal, jika $m$ merupakan perpangkatan angka 2, maka $c$ perlu bernilai ganjil), sehingga nilai $c=1$ umum dipilih.

Barisan yang dihasilkan dari pemilihan $c$ yang lain dapat ditulis sebagai fungsi sederhana dari barisan ketika $c=1$ .^[12] Secara spesifik, jika $Y$ adalah barisan yang didefinisikan dengan $Y_{0}=0$ dan $Y_{n+1}=aY_{n}+1\ \ {\text{mod}}\ \ m$ , maka barisan $X_{n+1}=aX_{n}+c\ \ {\text{mod}}\ \ m$ dapat ditulis sebagai fungsi affine dari $Y$ :

$X_{n}=(X_{0}(a-1)+c)Y_{n}+X_{0}=(X_{1}-X_{0})Y_{n}+X_{0}{\pmod {m}}.$

Secara umum, dua barisan $X$ dan $Z$ yang memiliki pengali dan modulus yang sama memiliki hubungan:

{X_{n}-X_{0} \over X_{1}-X_{0}}=Y_{n}={a^{n}-1 \over a-1}={Z_{n}-Z_{0} \over Z_{1}-Z_{0}}{\pmod {m}}.

Parameter yang umum digunakan

Tabel berikut berisi daftar parameter LCM yang umum digunakan, termasuk fungsi rand() yang umum dimiliki oleh banyak kompilator. Tabel ini hanya menunjukkan parameter yang populer, bukan sebagai parameter implementasi yang baik. Tabel dengan parameter yang bagus tersedia.^[3]^[18]

Sumber	modulus $m$	pengali $a$	penambah $c$	bit keluaran pada `rand()` atau `Random(L)`
Numerical Recipes	2³²	1664525	1013904223
Borland C/C++	2³²	22695477	1	bit 30..16 pada `rand()`, 30..0 in `lrand()`
glibc (digunakan oleh GCC)^[19]	2³¹	1103515245	12345	bit 30..0
ANSI C: Watcom, Digital Mars, CodeWarrior, IBM VisualAge C/C++ ^[20]C90, C99, C11: Saran dalam ISO/IEC 9899,^[21] C18	2³¹	1103515245	12345	bit 30..16
Borland Delphi, Virtual Pascal	2³²	134775813	1	bit 63..32 dari `seed × L`
Turbo Pascal	2³²	134775813 (8088405₁₆)	1
Microsoft Visual/Quick C/C++	2³²	214013 (343FD₁₆)	2531011 (269EC3₁₆)	bit 30..16
Microsoft Visual Basic (versi 6 dan sebelumnya)^[22]	$224$	1140671485 (43FD43FD₁₆)	12820163 (C39EC3₁₆)
RtlUniform dari Native API^[23]	2³¹ − 1	2147483629 (7FFFFFED₁₆)	2147483587 (7FFFFFC3₁₆)
Apple CarbonLib, `minstd_rand0` milik C++11^[24]	2³¹ − 1	16807	0	lihat MINSTD
C++11's `minstd_rand`^[24]	2³¹ − 1	48271	0	lihat MINSTD
MMIX oleh Donald Knuth	2⁶⁴	6364136223846793005	1442695040888963407
Newlib, Musl	2⁶⁴	6364136223846793005	1	bit 63..32
VMS's MTH$RANDOM,^[25] versi lawas dari glibc	2³²	69069 (10DCD₁₆)	1
Java's java.util.Random, POSIX [ln]rand48, glibc [ln]rand48[_r]	2⁴⁸	25214903917 (5DEECE66D₁₆)	11	bit 47..16
`random0`^[26]^[27]^[28]^[29]^[30]	134456 = 2³7⁵	8121	28411	${\frac {X_{n}}{134456}}$
POSIX^[31] [jm]rand48, glibc [mj]rand48[_r]	2⁴⁸	25214903917 (5DEECE66D₁₆)	11	bit 47..15
POSIX [de]rand48, glibc [de]rand48[_r]	2⁴⁸	25214903917 (5DEECE66D₁₆)	11	bit 47..0
cc65^[32]	2²³	65793 (10101₁₆)	4282663 (415927₁₆)	bit 22..8
cc65	2³²	16843009 (1010101₁₆)	826366247 (31415927₁₆)	bit 31..16
Pernah umum digunakan: RANDU ^[13]	2³¹	65539	0

Seperti terlihat di atas, LCM tidak selalu menggunakan semua bit bilangan yang dihasilkan. Sebagai contoh, implementasi Java beroperasi dengan 48-bit pada setiap iterasi, namun hanya menghasilkan nilai dari 32 bit pertama. Hal ini disebabkan karena bit dengan order yang lebih tinggi memiliki periode yang lebih lama dibandingkan dengan bit dengan order rendah. LCM yang menggunakan teknik pemotongan bit ini menghasilkan nilai yang secara statistik lebih baik jika dibandingkan dengan yang tidak. Hal ini terlihat pada implementasi kode yang menggunakan operasi modulo untuk memperkecil jangkauan hasil; tanpa pemotongan, modulo 2 dari bilangan acak yang dihasilkan akan menghasilkan hasil 0 dan 1 yang periodik.

Kelebihan dan kekurangan

Metode LCM cepat dan hanya memerlukan memori yang kecil (satu bilangan modulo-m, umumnya 32 atau 64 bit) untuk penyimpanan sementara bilangan yang dihasilkan. Hal ini yang membuat LCM berguna untuk menyimulasikan beberapa keadaan independen. LCM tidak ditujukan, dan jangan digunakan, untuk aplikasi dalam bidang kriptografi; pembangkit bilangan acak semu (Inggris: pseudo random number generator, PRNG) yang aman secara kriptografi diperlukan untuk hal tersebut.

Walau LCM memiliki beberapa kelemahan spesifik, kebanyakan kelemahannya diakibatkan dari pemilihan parameter yang terlalu kecil. LCM dengan parameter yang cukup besar dapat lulus dari tes statistik yang ketat; LCM modulo-2 yang menghasilkan 32 bit bilangan lulus SmallCrush oleh TestU01,^{[butuh rujukan]} dan LCM 96-bit lulus dari tes BigCrush yang jauh lebih sulit.^[33]

Untuk contoh yang spesifik, pembangkit bilangan acak semu (PNRG) dengan keluaran 32 bit, memiliki ekspektasi (lewat teorema Birthday) mulai mengulangi keluaran yang pernah dihasilkan setelah melakukan ${\sqrt {m}}\approx 2^{16}$ keluaran. Setiap PNRG dengan keluaran tanpa pemotongan bit, tidak akan berulang sampai periode maksimumnya tercapai; sebuah cacat statistik yang mudah dideteksi. Dengan alasan serupa, PNRG perlu memiliki periode yang lebih panjang daripada akar dari banyak keluaran yang diinginkan. Mempertimbangkan kecepatan komputer modern, periode sebesar $2^{64}$ dibutuhkan untuk aplikasi kurang penting (secara kriptografi), dan periode yang lebih besar untuk aplikasi yang penting.

Satu kecacatan spesifik LCM adalah, jika digunakan untuk memilih titik pada ruang dimensi $n$ , titik tersebut akan terletak (maksimal) pada ${\sqrt[{n}]{n!m}}$ hyperplane, berdasarkan teorema Marsaglia (yang dikembangkan oleh George Marsaglia).^[34] Hal ini disebabkan oleh serial correlation antar nilai yang berurutan pada barisan $X_{n}$ . Pengali yang dipilih dengan lalai umumnya menghasilkan sedikit bidang, dengan jarak antar bidang yang besar, yang dapat menyebabkan masalah. Uji spektral, yang merupakan tes kualitas LCM yang sederhana, mengukur jarak antar bidang dan memungkinkan untuk memilih nilai pengali yang baik.

Jarak antar bidang bergantung pada modulus dan pengali LCM. Modulus yang cukup besar dapat memperkecil jarak ini sehingga kurang dari bilangan double precision. Pemilihan pengali menjadi kurang penting ketika modulus yang dipakai besar. Namun masih penting untuk menghitung indeks spektral dan memastikan tidak memilh pengali yang buruk, walau secara statistik hampir mustahil mendapatkan pengali yang buruk ketika nilai modulus lebih besar dari $2^{64}$ .

Salah satu kecacatan lain yang spesifik pada LCM adalah periode bit-rendah yang pendek ketika $m$ dipilih sebagai bilangan perpangkatan 2. Hal ini dapat dihindari dengan menggunakan modulus yang lebih besar daripada banyak keluaran yang diinginkan, dan menggunakan bit-bit tinggi dari hasil yang dikeluarkan.

Walaupun demikian, LCM dapat menjadi pilihan yang bagus untuk beberapa aplikasi. Sebagai contoh, pada sistem tertanam, banyak memori yang tersedia sangat terbatas. Pada lingkungan yang serupa, seperti pada konsol permainan, mengambil beberapa bit-tinggi dari LCM mungkin sudah cukup. Keacakan nilai bit-bit rendah dari LCM dengan modulus berupa perpangkatan 2 tidak disarankan untuk digunakan. Hal ini disebabkan karena periode yang sangat pendek. Sebagai contoh, LCM dengan modulus berupa perpangkatan 2, dan dengan hasil yang tidak mengalami pemotongan bit, akan menghasilkan bilangan genap dan bilangan ganjil yang berselang-seling.

LCM perlu dievaluasi secara mendalam untuk penggunaan pada aplikasi non-kriptografis yang memerlukan kualitas keacakan tinggi. Untuk simulasi Monte Carlo dibutuhkan LCM dengan nilai modulus yang (jauh) lebih besar daripada pangkat tiga dari banyak keluaran yang dibutuhkan. Hal ini mengartikan, sebagai contoh, LCM 32 bit (yang baik) dapat digunakan untuk menghasilkan sekitar 1000 bilangan acak, dan LCM 64 dapat digunakan untuk menghasilkan $2^{21}$ (sedikit diatas dua juta) bilangan. Karena keadaan tersebut, LCM secara praktis tidak cocok untuk simulasi Monte Carlo skala besar.

Implementasi

Berikut salah satu implementasi LCM dalam bahasa pemrograman Python:

def lcg(modulus, a, c, seed):    """Linear congruential generator."""    while True:        seed = (a * seed + c) % modulus        yield seed

Seperti semua pembangkit bilangan acak semu lainnya, LCM perlu menyimpan dan mengubah keadaan bilangan acak yang dihasilkan. Komputer dengan banyak utas yang mengakses keadaan ini dapat menyebabkan race condition. Implementasi dengan setiap utas memiliki inisialisasi nilai awal yang unik diperlukan agar tidak ada utas dengan barisan bilangan acak yang sama.

Turunan LCM

Terdapat beberapa pembangkit dengan bentuk yang didasarkan pada LCM, sehingga teknik yang digunakan untuk menganalisis LCM juga dapat dipakai untuk mereka.

Salah satu metode untuk menghasilkan periode yang lebih panjang adalah dengan menjumlahkan beberapa LCM, dengan periode yang berbeda dan memiliki faktor bersama yang besar. Pembangkit Wichmann-Hill adalah salah satu contoh metode ini. Metode ini dapat ditunjukkan ekuivalen dengan sebuah LCM dengan modulus sebagai hasil perkalian modulus LCM komponen-komponennya.

Referensi

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

Search

Metode linear kongruen

Daftar isi

Demonstrasi

Sejarah

Panjang periode

m bilangan prima, c = 0

m perpangkatan 2, c = 0

c ≠ 0

Parameter yang umum digunakan

Kelebihan dan kekurangan

Implementasi

Turunan LCM

Referensi