Beberapa nilai dalam Teraflops (TFLOPs) ditampilkan dalam pengumuman perangkat keras, lembar spesifikasi, dan beberapa demo. Nilai-nilai ini terkait langsung dengan kinerja GPU, tetapi hal-hal dapat bervariasi tergantung di mana kami menggunakan perangkat keras tersebut.
Teraflop adalah ukuran daya komputasi yang dapat diberikan sistem per detik. TFLOP berarti triliunan kalkulasi per detik.
Apa itu TFLOP dan Apa Fungsinya?
Seperti yang Anda ketahui, mengukur kinerja komputer secara langsung tidaklah mudah. Sebuah sistem yang bekerja dengan baik dalam satu beban kerja mungkin bekerja dengan buruk dalam tugas yang berbeda. Tergantung pada apa yang Anda lakukan, laptop generasi baru mungkin bekerja lebih baik daripada superkomputer sepuluh tahun lalu.
Tidak seperti gigahertz (GHz), yang mengukur kecepatan jam prosesor, TFLOP adalah pengukuran matematis langsung dari kinerja komputer.
Selain itu, banyak aspek seperti kecepatan jam, jumlah inti, dan bahkan perintah per detik tidak selalu dapat dibandingkan secara langsung. Ada banyak faktor yang mempengaruhi kinerja sebuah perangkat keras, terlepas dari CPU atau GPU. Arsitektur datang pertama.
Istilah FLOPS (floating-point operations per second) telah digunakan sejak lama, tetapi seiring dengan semakin kuatnya perangkat keras, kami mulai beralih ke TFLOPS. TFLOPS adalah alat pengukuran yang mengubah generasi dan bahkan antar komponen yang berbeda untuk memberikan ukuran yang lebih kuat tentang apa yang dapat dilakukan komputer. Dengan kata lain, kinerja perangkat keras TFLOPS dari generasi yang berbeda, dengan arsitektur yang sama sekali berbeda dan detail teknis yang berbeda, dapat dibandingkan. Tapi sekali lagi, TFLOPS tidak menentukan dengan sendirinya.
Bagaimana TFLOPS Mempengaruhi Performa?
Aritmatika floating-point adalah metode komputasi yang membuat beberapa tradeoff antara akurasi dan kinerja. Sebagai metrik, FLOPS memberikan ukuran berapa banyak dari perhitungan ini yang dapat dilakukan per detik. Selain itu, tolok ukur teraflop memiliki metrik yang berbeda seperti 16 bit (presisi setengah), 32 bit (presisi tunggal) dan 64 bit (presisi ganda).
Beban kerja yang berbeda mendapat manfaat dari jenis FLOPS yang berbeda; game fokus pada presisi tunggal, sementara tugas yang lebih ilmiah dan kalkulasi AI mendapat manfaat dari FLOPS presisi ganda.
Tetapi tugas apa pun yang Anda lakukan, perangkat modern yang Anda gunakan untuk melakukannya sangat cepat sehingga kinerjanya diukur dalam TeraFLOPS (TFLOPS), bukan FLOPS. Setiap TFLOP sama dengan satu triliun kalkulasi per detik.
Dalam hal kinerja kartu grafis, tolok ukur TFLOP telah digunakan lebih banyak selama sepuluh tahun terakhir. AMD merilis kartu grafis berkemampuan TFLOPS pertamanya pada tahun 2008 dan memecahkan penghalang 2 TFLOP pada tahun yang sama.
Kartu grafis dan konsol game modern jauh lebih cepat dan lebih mumpuni. Ini menawarkan berkali-kali kinerja TFLOP dari GPU lama. Misalnya, RTX 3090 memiliki kinerja shader sekitar 36 TFLOPS. Penggantinya, RTX 4090, jauh lebih berperforma dalam hal daya komputasi mentah, dengan 82,6 TFLOPS. GPU seluler seperti Radeon Pro 5600M di MacBook Pro Apple menawarkan sekitar 5,3 TFLOPS.
China Membuat Perbandingan MTT S80 dan GTX 1050 Ti
Dari waktu ke waktu Dari pabrikan GPU Cina, Moore Threads dan kartu grafis seri MTT kita bicarakan. Meskipun kartu ini sukses dalam hal kekuatan kinerja mentah, mereka menawarkan kinerja biasa-biasa saja karena pengoptimalan dan driver yang buruk. Sekarang mari kita lihat perbandingan dua kartu yang sama sekali berbeda dengan daya komputasi 14.2 dan 2.1 TFLOPS.
Kartu ini ditenagai oleh GPU yang tampaknya menggunakan arsitektur Imagination Technologies PowerVR, meskipun ada yang disembunyikan oleh manajemen Moore Threads. Sedangkan untuk spesifikasi resminya, graphics card ini dibangun dengan arsitektur Chunxaio menggunakan 4096 MUSA core. GPU memiliki clock 1,8 GHz dan 14.2 TFLOPSIni memiliki kinerja komputasi. Sampel yang diuji oleh PC Watch memiliki memori 16GB GDDR6 14Gbps. Sementara memori terhubung ke GPU melalui bus 256-bit, mereka dapat memberikan bandwidth 448 GB/s.
Tes | MT S80 | GTX 1050Ti |
---|---|---|
Tanda 3D 06 | 28589 | 61414 |
Lembah Unigine (DX9) | 2707 | 5180 |
Serangan Balik: Serangan Global (DX9) | 92.5 | 211.5 |
Gajian 2 (DX9) | 72.6 | 104.3 |
Pencarian Naga X (DX9) | 103.3 | 156.9 |
Pengepungan Enam Pelangi (DX11) | 35.0 | 165.5 |
Puncak Legenda (DX11) | 29.9 | 108.9 |
Gulungan Tua: Skyrim SE (DX11) | 25.2 | 70.2 |
Asetto Corsa (DX11) | 3.5 | 318.9 |
Final Fantasi XIV (DX11) | 32.8 | 55.5 |
Valheim (DX11) | 19.3 | 30.0 |
Rata-rata keseluruhan | 90.0 | 277.1 |
Seperti yang dapat Anda lihat dengan jelas di tabel, MTT S80 jauh di bawah GeForce GTX 1050 Ti, kartu anggaran yang dirilis pada tahun 2016. Menawarkan memori GDDR5 4GB, TGP 75W, dan bandwidth 112GB/dtk, GTX 1050 Ti tersedia di atas kertas 2.1 TFLOPS memiliki kekuatan pemrosesan. Bahkan dengan persaingan yang begitu lemah, kartu Moore Threads gagal. Performa MTT S80 lebih baik dalam benchmark grafis DX9. Tapi itu di belakang GTX 1050 Ti dalam segala hal.
Tolok Ukur TFLOPS: PlayStation 5 vs Xbox Series X
Konsol game generasi terbaru Sony dan Microsoft PS5 dan Xbox Series X adalah dua konsol paling kuat di pasar. Kedua konsol menggunakan AMD APU (Accelerated Processing Unit) khusus yang menggabungkan delapan inti CPU Zen 2 dan inti grafis RDNA2 khusus.
TFLOPS adalah cara yang lebih bermanfaat untuk benchmark dan performa pada perangkat keras yang sebanding. Sementara chip grafis PS5 menghasilkan daya 10,28 TFLOPS, chip Xbox Series X dapat mencapai hingga 12 TFLOPS.
Singkatnya, ada peningkatan besar dalam performa murni dibandingkan dengan konsol generasi sebelumnya. Xbox One X memiliki akurasi satu titik 6 teraflops, sedangkan PS4 Pro mencapai 4,2 TFLOPs.
Semua daya tambahan ini memungkinkan ray tracing yang dipercepat perangkat keras, bersama dengan dukungan untuk frekuensi gambar dan resolusi yang lebih tinggi. Selain itu, kinerja semakin didorong oleh penerapan algoritme kepemilikan Microsoft untuk bayangan laju variabel (VRS); Algoritme baru merender pemandangan dalam detail berbeda tergantung di mana fokusnya. Dengan demikian, kinerja dimaksimalkan di tempat yang paling dibutuhkan, dan sumber daya sistem digunakan secara efisien.
Keterbatasan TFLOPS
Betapapun bermanfaatnya TFLOPS, ini hanya mempertimbangkan satu aspek kinerja dan potensi mentah dari kartu grafis atau konsol game. Tidak ada detail teknis seperti kecepatan jam, arsitektur, jumlah core, teknologi manufaktur, atau kecepatan memori yang diperhitungkan. Singkatnya, ini adalah tolok ukur yang berguna saat membandingkan, tetapi itu saja tidak cukup.
Ini terutama benar dalam hal permainan. Seperti yang dapat Anda lihat pada contoh sebelumnya, ada faktor lain yang memengaruhi performa game dunia nyata GPU. Baik konsol atau PC, game membutuhkan banyak perangkat keras seperti CPU, memori, GPU, VRAM, dan penyimpanan. Kemacetan komponen dapat memperlambat keseluruhan sistem, dan tidak semua aspek permainan memiliki ketergantungan yang sama pada setiap komponen.
Selain itu, pengaturan yang dipilih oleh pengguna juga penting. Anda dapat memiliki kartu grafis terkuat di dunia dengan TFLOPS setinggi mungkin, tetapi jika Anda bermain game pada 1080P, Anda tidak akan pernah dapat menggunakan kapasitas penuh.