Một thí nghiệm dùng ChatGPT

Phần 1: ChatGPT làm thơ tiếng Anh

Hiện nay, ChatGPT đang là đề tài thời thượng làm náo động dư luận khắp nơi trên thế giới, và Donald Trump đang vận động hướng đến kỳ bầu cử Tổng thống năm 2024.

Tôi thử nhờ ChatGPT làm cho một bài thơ theo thể Limerick về Trump vận động tranh cử xem sao, và được ChatGPT làm cho bài sau đây:

There once was a man named Trump,
Whose political ambitions did thump,
He lost the last race,
But still wants to chase,
The White House, a victory to pump.

With hair like a bird’s messy nest,
And a tweeting habit he can’t divest,
He’s hitting the trail,
With a boastful exhale,
And claiming he’s still the best.

But many are tired of his act,
His divisive words and attacks,
They hope he’ll retire,
And his dreams will expire,
And fade away like an old hat.

So will he make another run?
And try for a win that he’s already spun?
Only time will tell,
But one thing is quite swell,
The memes and jokes will never be done.

Limerick là thể thơ ngắn gồm năm dòng: Hai dòng đầu mỗi dòng có tám/chín từ; hai dòng tiếp theo ngắn hơn, có năm/sáu từ; và dòng cuối cùng kết luận với tám/chín từ; có vần chân (cước vận) nghiêm chỉnh AABBA. Mỗi bài thơ thường kể một câu chuyện hài hước, dùng từ diễu cợt.

Trong vòng vài mươi giây, ChatGPT đã sáng tác không chỉ một mà đến 4 bài Limerick! Đúng quy luật về số dòng số chữ (metrics) và vần điệu (rhyme), cả 4 bài đều đọc lên nghe được lắm, ngang ngửa với người biết làm thơ.

*

Hứng thú với kết quả đó, tôi bèn thử nhờ làm tiếp một bài theo thể thơ Sonnet, về chuyện Trump vẫn khoe mình là “thiên tài an định – stable genius” và là “nhà ái quốc – patriot.” ChatGPT đã viết ra như sau:

Amidst the tweets and media fights,
A voice rises loud and clear,
“I’m a genius, a man of great might,
And a patriot, beyond any fear.”

The man behind this bold claim,
Is none other than Donald Trump,
With ego as big as his name,
And a tongue that always jumps.

He claims to know all the best words,
And the best people too,
But his actions and deeds are absurd,
And his words are often untrue.

Yet he stands there with pride and might,
A self-proclaimed genius and patriot,
But many know his words aren’t right,
And his claims are often chaotic.

So let us hope that he’ll soon retire,
And leave the rest of us to aspire.

Các bài sonnet của Shakespeare thường gồm 3 khổ thơ 4 dòng và khổ kết 2 dòng, tổng cộng 14 dòng.

Bài Sonnet d’Arvers bằng tiếng Pháp được nhiều người Việt biết đến thì có 2 khổ thơ 4 dòng rồi 2 khổ 3 dòng, tổng cộng cũng 14 dòng; đã được Khái Hưng dịch thành bài thơ “Tình Tuyệt Vọng” được yêu thích qua nhiều thế hệ người Việt. “Lạnh lùng lòng sẻ hỏi lòng, Người đâu tả ở mấy dòng thơ đây?”

Bài sonnet do ChatGPT sáng tác đã cho thêm 1 khổ 4 dòng, thành 16 dòng. Vần chân cách dòng đúng theo quy định. Bố cục chặt chẽ: đề, phá, thừa, kết đầy đủ tuy có hơi máy móc. Nội dung trung thực, là điều đáng quý trong thời buổi thông tin nhiễu nhương đầy fake news ngày nay. Chữ nghĩa giản dị mà hóm hỉnh, nhất là đoạn “With ego as big as his name, And a tongue that always jumps” thì lột tả được rất tài tình và chính xác cá tính của nhân vật. Tôi nghĩ là giám khảo nào có khó tính đến mấy cũng cho điểm bài sonnet này trên trung bình.

Phần 2: ChatGPT làm thơ tiếng Việt

ChatGPT phục vụ nhiều thứ ngôn ngữ, trong đó có tiếng Việt. Tôi thử xem khả năng của ChatGPT trong tiếng Việt ra sao, với vài câu hỏi, và lời đáp như sau (nguyên văn):

ChatGPT có biết thể thơ lục bát, song thất lục bát, thất ngôn tứ tuyệt và thơ Đường luật không?

Có, ChatGPT có thể biết về những thể thơ mà bạn đề cập.

Thể thơ lục bát là một thể thơ truyền thống của Việt Nam, gồm 6 câu vần thơ mỗi bài, mỗi câu có 8 âm tiết.

Thể thơ “song thất lục bát” là một sáng tác thơ ca phức tạp hơn, với 8 câu vần thơ mỗi bài, mỗi câu có 7 hoặc 8 âm tiết.

Thể thơ “thất ngôn tứ tuyệt” là một thể thơ ngắn gọn với 4 câu vần thơ mỗi bài, mỗi câu có 7 hoặc 8 âm tiết.

Thơ Đường luật là một thể thơ phổ biến trong văn học Trung Quốc, gồm năm bộ phận vần, mỗi phần chia thành bốn câu, tổng cộng 20 câu vần thơ.

Tuy nhiên, ChatGPT là một chương trình máy tính và không có khả năng cảm nhận được thơ ca hay văn chương như con người. ChatGPT chỉ có khả năng sinh ra và phân tích các chuỗi ký tự để tạo ra các câu văn hay thơ ca dựa trên mô hình ngôn ngữ và các thuật toán học máy.

*

Các thể thơ nói trên thì, thơ lục bát hầu như ai cũng biết qua ca dao, và các truyện thơ dân gian khác; và học sinh trung học đều có học Truyện Kiều – Nguyễn Du, Chinh phụ ngâm – Đoàn thị Điểm, Nam quốc sơn hà – Lý Thường Kiệt, Qua đèo Ngang – Bà Huyện Thanh Quan, nên không lạ gì các thể thơ đó.

Thế nên không biết ChatGPT đã dựa vào đâu mà giải thích lạng quạng đến mức khó tin được về các thể thơ tiếng Việt như thế.

Đặc biệt về thể thơ Đường luật ChatGPT đã trả lời là biết, rằng:

“Thơ Đường luật là một thể thơ phổ biến trong văn học Trung Quốc, gồm năm bộ phận vần, mỗi phần chia thành bốn câu, tổng cộng 20 câu vần thơ.”

Tôi suy đoán rằng trong kho dữ liệu của ChatGPT (hay GPT-3, bao phủ thông tin cho đến trọn năm 2021, có 175 tỉ thông số – parameter, theo báo chí cho biết) hẳn đang có thông tin “Thơ Đường luật là một thể thơ phổ biến trong văn học Trung Quốc, gồm năm bộ phận vần” thật, nhưng chỉ có thế thôi.

Phần còn lại, ChatGPT đã đoán mò (theo thuật toán – algorithm) là năm “bộ phận vần” mà mỗi bộ phận vần là bốn câu (theo thể thơ mà ChatGPT rất “ưng ý” và dùng nhiều trong các “tác phẩm thơ” của ChatGPT trong tiếng Anh và cả tiếng Việt nữa, ChatGPT gọi đó là thể thơ Free Verse, nhưng thật sự không phải “thơ tự do – Free Verse” mà là loại thơ tiếng Anh có vần chân cho từng cặp hai dòng tiếp nhau hay cách nhau).

Thế nên ChatGPT đã tính ra rằng bài thơ Đường luật “chắc hẳn” là gồm 20 câu! Và ChatGPT đã mạnh dạn cho biết “tổng cộng 20 câu vần thơ”!

Chưa kể cụm từ “câu vần thơ” trong lời đáp của ChatGPT không đúng tiếng Việt, mà phải là: câu thơ (có) vần.

Lời đáp như thế khiến phải nghi ngờ, nên tôi hỏi tiếp và được trả lời như sau (nguyên văn):

ChatGPT có thể làm được thơ theo các thể thơ đó hay chưa?

*

Có, ChatGPT có khả năng tạo ra các bài thơ theo các thể thơ như lục bát, thất ngôn tứ tuyệt, thơ Đường luật và nhiều thể thơ khác.

Tuy nhiên, đôi khi những bài thơ do ChatGPT tạo ra có thể không mang lại cảm giác tự nhiên hoặc không hoàn toàn rõ ràng. Điều này là bởi vì ChatGPT không có khả năng cảm nhận hay hiểu được tình cảm hay ngữ nghĩa của từng từ trong bài thơ. ChatGPT chỉ có thể sử dụng mô hình ngôn ngữ và các thuật toán học máy để phân tích các dữ liệu ngôn ngữ và tạo ra các bài thơ mới.

Vì vậy, bài thơ được tạo ra bởi ChatGPT có thể hữu ích trong việc đưa ra những ý tưởng mới hoặc kích thích sự sáng tạo, nhưng chúng không thể thay thế được những bài thơ được tạo ra bởi con người với cảm xúc và trí tưởng tượng riêng.

*

Tôi thử xem có thật ChatGPT làm được thơ lục bát (là thể thơ dễ làm và phổ biến nhất ở VN), như ChatGPT đã cho biết, hay không. Kết quả là (nguyên văn):

Làm thơ lục bát châm biếm về sở trường của ChatGPT xem sao.

*

Nằm mơ nhưng không ghi lại
Đôi lần lại bị quên ngay
ChatGPT vốn sở trường là
Nhớ kiến thức tới muôn đời

Hỏi sao lại cứ đem ra
Dịch lời tiếng Anh đến ta
Tình cảm ơi sao xa vời
Chỉ còn lại mãi dòng ta

Máy móc học đòi năng lực
Giải bài toán, trả lời nhục
Làm thơ chăng chỉ là thế
Nhưng đôi lúc cũng bị bắt nạt

ChatGPT hỡi đừng tự tin
Sở trường vốn chẳng phải tin
Cứ học hỏi thêm từng ngày
Để có thể chinh phục tình.

*

Bài này của ChatGPT hoàn toàn chẳng phải là thơ lục bát như đã được nhờ làm, mà cũng chẳng giống tí gì với lời giải thích về thể thơ lục bát của chính ChatGPT! Và thú thật có rất nhiều câu, nhiều từ ngữ tôi chẳng hiểu đã được lắp ghép với nhau theo quy luật hay luận lý gì. “Chỉ còn lại mãi dòng ta”, “Giải bài toán, trả lời nhục”, “Sở trường vốn chẳng phải tin”,… chẳng hạn. Và câu “Hỏi sao lại cứ đem ra, Dịch lời tiếng Anh đến ta” khiến tôi ngờ rằng ChatGPT đã phải dùng đến bộ máy phiên dịch Việt Anh – Anh Việt trong quá trình chọn từ và sắp xếp thành câu tiếng Việt! Ngay cả hình thức thơ cũng có vẻ thuộc loại Free Verse trong thơ tiếng Anh, mà ChatGPT ưa dùng khi được nhờ làm thơ tiếng Anh.

Vẫn còn choáng váng vì hồi đáp vừa rồi, tôi thử xem có thật như ChatGPT đã cho biết là ChatGPT làm được thơ Đường luật (là thể thơ có quy luật khó khăn bậc nhất), hay không, và nhận được kết quả như sau (nguyên văn):

Làm thơ Đường luật châm biếm về sở đoản của ChatGPT xem sao.

*

ChatGPT vốn nhiệt tình học tập
Lần theo dòng kiến thức đầy cạn
Nâng cao trình độ, tay nghề đa dạng
Để khách hàng mãi tin tưởng sử dụng

Tuy nhiên, sở đoản của nó cũng không ít
Thỉnh thoảng không hiểu câu hỏi người dùng
Trả lời chưa đúng, hay vô căn cứ
Ai biết đâu bằng trực giác của con người

Đường luật đã khuyên rằng: “Học nhiều thuộc ít”
Ai hay dùng những từ ngữ vô nghĩa
Chắc chắn sẽ không thể giải quyết được vấn đề
ChatGPT hỡi, hãy học theo lời thánh thông.

*

Lại cũng như bài trước, bài này của ChatGPT hoàn toàn chẳng phải là thơ Đường luật như đã được nhờ làm, mà cũng chẳng giống với lời giải thích về thể thơ Đường luật của chính ChatGPT! ChatGPT vừa bảo là “hiểu” bài thơ Đường luật gồm 20 câu, 5 “bộ phận vần”, thế mà thực tế lại làm ra một bài chỉ có 12 câu, và chẳng có vần nào! Và có câu dùng từ ngữ tôi chẳng hiểu đã được lắp ghép với nhau theo quy luật hay luận lý gì. “Ai biết đâu bằng trực giác của con người”, “Đường luật đã khuyên rằng: Học nhiều thuộc ít” chẳng hạn.

Phần 3: Vấn đề ngôn ngữ

Các ví dụ vừa rồi cho thấy rằng: hiện tại, khả năng phục vụ của ChatGPT trong tiếng Anh so với trong tiếng Việt khác biệt đến một trời một vực.

Điều này không khó hiểu, bởi tất cả các cơ cấu chính của ChatGPT đều xây dựng trên nền tảng là tiếng Anh Mỹ, từ các kho dữ liệu khổng lồ (database), các mô thức hoạt động (model), các thuật toán (algorithm) cho đến các ngôn ngữ lập trình (programming language),… tất thảy đều biểu hiện bằng Anh ngữ, trước khi mã hóa thành số cho máy tính xử lý.

Và loại dữ liệu đặc biệt của các xã hội dùng ngôn ngữ khác tiếng Anh thì không có sẵn đến gần được mức đầy đủ như của cộng đồng Anh ngữ. Điều này phản ánh tình hình số lượng tích lũy của sách báo, văn kiện, tư liệu của các xã hội phi-Anh-ngữ kém xa số lượng của cộng đồng ngôn ngữ Anh Mỹ.

Lại nữa, tất cả các ứng dụng cho mọi ngôn ngữ khác đều qua những mô thức chuyên biệt và bộ máy phiên dịch, lại cũng được xây dựng trên nền tảng là Anh ngữ. Mà hiện tại, khả năng dịch thuật và các mô thức riêng cho ngôn ngữ ngoài tiếng Anh đều chưa đạt đến trình độ và phẩm chất đủ để thành sản phẩm thương mại. Đưa đến tình trạng khả năng phục vụ cho các ngôn ngữ khác tiếng Anh thì kém xa khả năng trong tiếng Anh.

Mà khác biệt đến một trời một vực này giữa ứng dụng tiếng Anh và ngôn ngữ nào khác, thì không chỉ với ChatGPT, đây là tình trạng chung cho mọi ứng dụng AI (artificial intelligence – trí tuệ nhân tạo).

Tình trạng như thế kéo dài làm nổi cộm lên vấn đề này: Sự thiệt thòi của người không biết tiếng Anh. Và gần gũi hơn, thiết thân hơn, là vấn đề:

Sự thiệt thòi của người chỉ biết tiếng Việt.

Tất nhiên, thiệt thòi đó không phải đến bây giờ mới có, hay mới được phát hiện, mà xưa nay vẫn có và được cảm nhận ít nhiều trong giới người Việt có quan tâm hay có giao tiếp với hải ngoại.

Ngày nay, AI hiện diện trong phần lớn các hoạt động công nghiệp, doanh nghiệp, và ngay cả trong sinh hoạt thường nhật của người tiêu dùng, dần dần nắm một vai trò chủ đạo trong cuộc cách mạng kỹ nghệ lần thứ ba đang tiến hành với trung tâm là năng lượng tái tạo, công nghệ IT và mạng lưới nối mọi thứ (IOT – Internet of Things).

Trong bối cảnh như thế, thiệt thòi của người chỉ biết tiếng Việt nổi bật lên, đòi hỏi sự quan tâm đúng mức và thảo luận nghiêm túc, hướng đến một đối sách hữu hiệu và khả thi.

Và yêu cầu ấy càng ngày càng cấp bách thêm, theo với mức độ phổ cập càng ngày càng rộng lớn và nhanh chóng của AI.

*

Thiệt thòi về ngôn ngữ trong bối cảnh toàn cầu hóa và trí tuệ nhân tạo hiện tại của thế giới là điều quan trọng cực độ nếu nhận thức rằng: Ngôn ngữ giữ vai trò quan trọng bậc nhất trong trình độ văn minh của cộng đồng.

Điều dễ nhận thấy là: ngôn ngữ và văn minh song hành và tương trợ nhau. Văn minh tiến lên thì ngôn ngữ giàu thêm nhiều thuật ngữ mới; và ngôn ngữ giàu thêm cho kịp thời đại lại thúc đẩy văn minh tiến lên. Cứ thế mà hình thành một vòng tròn tích cực để phát triển và tiến bộ.

Bởi văn minh là kết quả của sự tích lũy (cả trong thời gian, qua các thời đại, và không gian, qua các địa phương) những thành quả đã đạt được từ tiến bộ khoa học kỹ thuật (cả tự nhiên và nhân văn), mà những thành quả này là từ suy nghĩ của con người.

Con người suy nghĩ bằng ngôn ngữ, một khi vượt qua thời kỳ thơ ấu chưa biết nói. Và ở trình độ cao hơn thì con người suy nghĩ bằng chữ viết, khi đã đọc nhiều văn kiện, sách báo, và nhất là hiểu biết, ghi nhớ bằng chữ những khái niệm trừu tượng và có nội hàm bao quát.

Người sống song ngữ hay đa ngữ hiểu rằng khi nói tiếng Anh thì mình suy nghĩ bằng tiếng Anh, mà khi nói tiếng Việt thì suy nghĩ bằng tiếng Việt,… một cách tự nhiên và nhanh chóng hơn là phải phiên dịch qua lại hai thứ ngôn ngữ ấy.

Nếu ngữ vựng không có đủ thuật ngữ cho kịp với trình độ văn minh cao nhất trên thế giới hiện tại, thì người ta không thể có tư duy sáng tạo về khoa học kỹ thuật được. Có nghĩa là trình độ văn minh của dân tộc dựa vào ngôn ngữ đó không thể tiến theo kịp với thời đại.

Có thể nói rằng văn minh được xây dựng trên nền tảng là ngôn ngữ.

Và cũng có thể mạnh dạn mà suy đoán rằng ngôn ngữ đã có trước văn minh, lịch sử của ngôn ngữ lâu dài hơn lịch sử văn minh. Thử tưởng tượng xem từ ban sơ, con người sống đơn độc, tự do hoàn toàn và hoàn toàn không có khái niệm về tự do. Nhưng khi bắt đầu sống chung đụng với người khác thì tự nhiên nảy sinh nhu cầu truyền đạt ý chí, từ đó phát sinh ra ngôn ngữ, trước hết là tiếng nói, và khá lâu về sau, là chữ viết.

Chỉ từ khi có chữ viết thì mới có công cụ để tích lũy, cả trong thời gian tức là qua các thời kỳ tiếp nối, và không gian, qua nhiều địa phương trong cùng thời kỳ. Trên nền tảng dần cao hơn và vững chắc hơn, con người phát kiến và phát minh càng ngày càng nhiều, giúp xã hội con người càng phát triển – tiến bộ, làm nảy sinh ra khái niệm gọi là văn minh, tức là trình độ phát triển trong sinh hoạt của các cộng đồng nhân loại.

Văn minh là kết quả của sự tích lũy ấy.

Và nền tảng của văn minh là ngôn ngữ.

Phạm Vũ Thịnh

Sydney, 09/03/2023

From Exryu CT

5/5 - (3 votes)
Rakuten Marketing Welcome Program

Leave a Reply

Your email address will not be published. Required fields are marked *