Một YouTuber Ethiopia 112K dùng youtube-transcript.ai như thế nào — Và làm sao tôi đọc được video của anh ấy dù không biết một chữ tiếng Amharic

Một câu chuyện về việc phá bỏ rào cản ngôn ngữ bằng chính công cụ mà chúng tôi tạo ra.

Phát hiện tình cờ

Khi đang lục lọi dữ liệu phân tích trên PostHog, tôi nhận ra một điều kỳ lạ: một đợt truy cập tăng vọt đột ngột — 229 lượt trong bốn ngày — và gần một nửa đến từ Ethiopia. Nguồn giới thiệu là `youtube.com`, nhưng chính sách quyền riêng tư của YouTube đã cắt bỏ URL chính xác, nên tôi chỉ biết là đâu đó trên YouTube đang gửi người dùng thật sang chỗ chúng tôi.

Sau một hồi tìm kiếm, tôi đã lần ra nguồn:

Bahiru Abas, người dẫn chương trình Dotcom TV Show, một kênh công nghệ - giáo dục của Ethiopia với 112.000 người đăng ký, đã đăng một video với tựa đề:

ከጭንቀት የሚገላግላችሁን "AI" ላስተዋውቃችሁ!!
"Để tôi giới thiệu với các bạn 'AI' sẽ giải tỏa căng thẳng cho bạn!!"

21.000 lượt xem trong bốn ngày. Và trong phần mô tả, không hề có bất kỳ tài trợ nào, anh ấy đã viết:

Để lấy phụ đề của bất kỳ video YouTube nào, hãy truy cập:
https://youtube-transcript.ai/

Chỉ vậy thôi. Đó chính là nơi luồng truy cập đến từ đó.

Một vấn đề nhỏ

Tôi muốn xem video để hiểu anh ấy đang dạy gì — điều gì khiến khán giả của anh tin tưởng một công cụ miễn phí từ một trang web họ chưa từng nghe đến?

Nhưng video lại bằng tiếng Amharic (አማርኛ) — ngôn ngữ chính thức của Ethiopia. Một ngôn ngữ thuộc nhóm Semit, viết bằng hệ chữ riêng (Ge'ez / Fidäl), với khoảng 57 triệu người nói trên toàn thế giới, và là một ngôn ngữ mà tôi chưa từng chạm tới một lần trong đời.

Tôi không đọc nổi cái tựa đề. Tôi không hiểu được lấy một giây âm thanh. Tính năng tự động dịch của YouTube thì hoạt động vụng về với tiếng Amharic, còn việc tua qua tua lại một video dài 26 phút với hy vọng bắt được vài manh mối hình ảnh thì thật vô lý.

Thế nên tôi đã làm điều hiển nhiên nhất.

Tôi đưa video vào chính công cụ của mình

Tôi dán URL YouTube vào youtube-transcript.ai. Chỉ trong vài giây, nó trả về toàn bộ bản phụ đề tiếng Amharic — từng dòng có dấu thời gian, từng chữ Bahiru nói. Rồi tôi đưa bản phụ đề đó vào Gemini với một câu lệnh đơn giản:

"Dịch bản phụ đề tiếng Amharic này sang tiếng Anh và trích xuất các điểm dạy học chính."

Và đột nhiên, một ngôn ngữ mà 30 giây trước tôi hoàn toàn không tiếp cận được đã trở thành tri thức đọc hiểu được trọn vẹn.

Điều này đáng để dừng lại suy ngẫm: luồng truy cập đưa Bahiru vào thế giới của tôi đến từ một công cụ tôi tạo ra. Công cụ giúp tôi hiểu được điều Bahiru đang dạy — bằng một ngôn ngữ hoàn toàn xa lạ với tôi — lại chính là cùng một công cụ ấy. Vòng tròn tự khép lại với chính nó.

Bahiru thực sự dạy điều gì

Một khi đã đọc được bản phụ đề, thông điệp của anh hóa ra lại sắc bén đến bất ngờ. Luận điểm của video 26 phút có thể cô đọng thành một câu mà anh lặp đi lặp lại xuyên suốt:

"Chúng ta béo phì vì thông tin, nhưng gầy guộc về tri thức."
በመረጃ ወፍራሞች ነን በእውቀት ግን ቀጫጮች ነን

Lập luận của anh: vấn đề của thời hiện đại không còn là tiếp cận thông tin nữa — YouTube, podcast, tin tức, tài liệu, mạng xã hội đều nhấn chìm chúng ta trong nhiều hơn mức ta có thể tiêu thụ. Vấn đề là tách tín hiệu ra khỏi nhiễu. Theo ước tính của anh, 80% nội dung bất kỳ chỉ là phần thừa thãi; chỉ 20% mới là tri thức có cấu trúc, dùng được.

Và anh dạy khán giả Ethiopia của mình — học sinh, người bán hàng, thợ đánh giày, bác sĩ, doanh nhân, bất kỳ ai — cách dùng AI (ChatGPT, Gemini, Grok, DeepSeek) để trích xuất 20% đó.

Đây là sáu quy trình cụ thể anh trình bày:

1. Biến một video YouTube 4 tiếng thành năm ý chính

Dán URL video vào youtube-transcript.ai → sao chép bản phụ đề → dán vào Grok/ChatGPT/Gemini → yêu cầu nó "tóm tắt năm ý chính." Anh trình diễn trực tiếp điều này trên một trong những video tiếng Amharic của chính mình ("Năm câu hỏi không bao giờ nên hỏi ChatGPT").

2. Đọc 15 trang kinh tế học khô khan trong 30 giây

Ví dụ của anh: một bài viết về lạm phát đầy thuật ngữ kinh tế mà bất kỳ độc giả bình thường nào cũng sẽ bỏ cuộc ngay từ đoạn thứ ba. Câu lệnh:

"Đính kèm là một văn bản dài bằng tiếng Amharic về lạm phát. Hãy giải thích khái niệm này theo cách mà một đứa trẻ 10 tuổi cũng hiểu được."

Lạm phát từ chỗ là "khái niệm chỉ người học cao mới hiểu" trở thành điều mà một người bán đánh giày cũng nắm được.

3. Biến sách giáo khoa thành cỗ máy ra đề thi vô tận

Dành cho học sinh: tải lên ghi chú của bạn về Cách mạng Pháp → yêu cầu AI tạo 5 câu hỏi thi → khi trả lời sai, hỏi nó giải thích tại sao, rồi yêu cầu nó ra câu hỏi khó hơn, rồi khó hơn nữa. Anh gọi đây là Active Recall (gợi nhớ chủ động) — đúng kỹ thuật mà khoa học nhận thức đã cổ vũ suốt nhiều thập kỷ, bỗng chốc trong tầm tay của mọi học sinh Ethiopia có một chiếc điện thoại.

4. Nắm địa chính trị hôm nay trong một đoạn văn

Thay vì xem 15 video thiên kiến về xung đột Mỹ/Israel/Iran:

"Tính đến ngày 19 tháng 4 năm 2026, hãy cho tôi một đoạn văn dựa trên sự thật tóm tắt những diễn biến mới nhất trong xung đột Mỹ/Israel/Iran, có trích dẫn nguồn thực."

Anh gọi đây là phân tích tổng quan — tổng hợp nhiều góc nhìn nhiễu loạn lại thành một sự thật được chắt lọc.

5. Đãi vàng từ một podcast

Một cuộc phỏng vấn CEO dài 2 tiếng? Câu lệnh: "Từ cuộc phỏng vấn này, hãy trích xuất những lời khuyên chính dành cho chủ doanh nghiệp nhỏ, và liệt kê mọi cuốn sách được nhắc đến." Một podcast, hấp thụ trọn vẹn.

6. Biến văn bản pháp lý thành thứ con người đọc được

Ví dụ thực tế nhất của anh: mua nhà. Người bán đưa cho bạn một hợp đồng mua bán dài 15 trang bằng tiếng Amharic đầy cạm bẫy pháp lý. Tải nó lên và yêu cầu một bản tóm tắt bằng ngôn ngữ dễ hiểu, bao quát các khoản thanh toán, thời hạn, hình phạt, bảo hành và những điểm đáng ngờ. "Nếu không," Bahiru cảnh báo, "bạn sẽ trở thành con rối trong tay bất kỳ ai."

Vì sao điều này quan trọng hơn cả con số lượt xem

Có vài điều khiến tôi suy nghĩ khi đọc trọn bản phụ đề:

Thứ nhất, Bahiru không chỉ đang giới thiệu một công cụ — anh đang dạy một sự chuyển dịch tư duy. Câu kết của anh:

"Trong thế giới ngày nay, thay vì là một người tiêu thụ, bạn cần trở thành một người trích xuất tri thức."

Cách diễn đạt đó — người tiêu thụ → người trích xuất — chính là sản phẩm mà chúng tôi đang xây dựng. Chỉ là chúng tôi chưa tìm ra từ ngữ cho nó, cho đến khi một thầy giáo công nghệ ở Addis Ababa nói ra theo cách ấy.

Thứ hai, đây chính là dáng hình của sự lan tỏa tự nhiên khi một công cụ thực sự giải quyết một vấn đề có thật. Bahiru chọn chúng tôi vì chúng tôi miễn phí, không cần đăng ký, và hoạt động với mọi ngôn ngữ — kể cả ngôn ngữ của anh. Với một creator mà khán giả có ít điều kiện tiếp cận các công cụ trả phí và các kênh thanh toán quốc tế, ba đặc tính đó không phải là thứ "có thì tốt." Chúng chính là điều khiến việc giới thiệu chúng tôi trở nên khả thi ngay từ đầu.

Thứ ba, và là điều cá nhân nhất với tôi: tôi vừa xem một buổi masterclass 26 phút bằng tiếng Amharic về học tập với AI, lấy được toàn bộ bản phụ đề, trích xuất những ý sâu sắc chính, và viết trọn bài blog này — mà không hiểu lấy một ký tự nào của ngôn ngữ gốc.

Hôm qua, với tôi cái video đó cũng như thể chưa từng tồn tại. Hôm nay nó là 1.500 chữ tri thức có cấu trúc nằm gọn trong app ghi chú của tôi.

Đó chính là toàn bộ ý nghĩa của thứ chúng tôi đang xây dựng. Tôi đã không nhận ra nó hiệu quả đến mức nào cho đến khi phải tự dùng nó lên chính mình.

Cảm ơn anh, Bahiru

Nếu tình cờ bài viết này đến được với Bahiru Abas — ameseginalehu (አመሰግናለሁ). 112.000 người đăng ký của anh đã đúng khi tin tưởng anh, và chúng tôi rất vinh dự được nằm trong bộ công cụ của anh. Chúng tôi rất mong được trò chuyện.

Hãy tự mình thử: dán bất kỳ URL YouTube nào — bất kỳ ngôn ngữ nào — vào youtube-transcript.ai. Bản phụ đề sẽ là của bạn chỉ trong vài giây. Còn bạn làm gì với nó tiếp theo — đó mới là nơi tri thức bắt đầu.

Dùng thử miễn phí