- Details
Bạn đã từng nghe đến Foundation Models, Multimodal AI hay những mô hình như CLIP, SAM, DINOv2,… nhưng chưa biết cách chúng thực sự vận hành ra sao?
Workshop #7 chính là cơ hội để bạn trực tiếp trải nghiệm các ứng dụng mạnh mẽ nhất của những mô hình này thông qua các demo thực hành trên Google Colab.
Thời gian: 20h-21h , ngày 22/8/2025
Hình thức: Online qua Google Meet
Link tham gia: https://meet.google.com/vvv-vvvo-fsf
Nội dung demo thực hành bao gồm:
- Zero-shot Object Detection – Phát hiện đối tượng trong ảnh mà không cần huấn luyện lại, sử dụng Grounding DINO.
- Image Retrieval – Tìm kiếm hình ảnh dựa trên đặc trưng học được từ DINOv2.
- Video Object Segmentation – Phân đoạn đối tượng trong video với Segment Anything Model (SAM).
- Vision–Language Alignment – Liên kết hình ảnh và ngôn ngữ bằng CLIP.
- Text-to-Image Generation – Sinh ảnh từ mô tả văn bản với VQGAN + CLIP.
- Visual Question Answering (VQA) – Hỏi đáp dựa trên hình ảnh với BLIP.
Đây là những ví dụ thực tiễn và sinh động, giúp bạn hiểu rõ cách các Foundation Models đang được ứng dụng trong thị giác máy tính và AI đa phương thức – từ nhận diện đối tượng, tìm kiếm ảnh, phân đoạn video đến tạo ảnh và trả lời câu hỏi trực quan.
Ngoài ra, Workshop còn giới thiệu thêm các chủ đề nâng cao:
- Thị giác 3D
- Mô hình kết hợp Vision–Language–Action
- Và mở rộng những nội dung đã học trong các buổi trước.

Đừng bỏ lỡ! Nếu bạn quan tâm đến AI, thị giác máy tính hoặc chỉ đơn giản muốn thấy AI hoạt động "thật" như thế nào – thì Workshop này dành cho bạn!
Hẹn gặp bạn tại Workshop #7!
- Details
Vào lúc 20h ngày 15/8/2025, Khoa Công nghệ Phần mềm đã tổ chức buổi workshop số 6 với chủ đề 'Xu hướng thị giác máy tính hiện đại'. Chương trình được diễn ra trực tuyến trên nền tảng Google Meet, dưới sự dẫn dắt và trình bày của Tiến sĩ Nguyễn Duy Khánh.
Trong bối cảnh trí tuệ nhân tạo phát triển nhanh, Thị giác Máy tính (Computer Vision) là một lĩnh vực quan trọng, đóng vai trò như “đôi mắt” của hệ thống thông minh. Workshop #6 giới thiệu quá trình phát triển của lĩnh vực này, từ các phương pháp truyền thống đến các kỹ thuật mới như Deep Learning, Vision Transformers và Foundation Models.
Buổi workshop tập trung vào cách các mô hình thị giác hiện đại không chỉ nhận diện hình ảnh, mà còn hiểu ngữ cảnh, phân tích nhiều khía cạnh và kết hợp thị giác với ngôn ngữ, âm thanh. Đây là nền tảng cho các hệ thống AI đa phương thức (Multimodal AI).






Một số chủ đề mở rộng như thị giác 3D và AI tạo sinh (Generative AI) sẽ được giới thiệu trong buổi workshop tiếp theo. Ngoài ra, buổi sau cũng sẽ đề cập đến các ứng dụng trong y tế, giao thông và nhiều lĩnh vực công nghệ khác, qua đó làm rõ vai trò ngày càng lớn của thị giác máy tính trong hệ sinh thái AI.
Hẹn gặp các bạn tại Workshop #7 vào ngày 22/08/2025
- Details
Khi lý thuyết tâm lý học kết hợp cùng chiến lược truyền thông, những vấn đề đô thị như ô nhiễm, kẹt xe có thể tìm ra giải pháp. Đó chính là cách ngành Truyền thông Đa phương tiện tại UIT đào tạo nên những nhà sáng tạo vừa giỏi công nghệ, vừa thấu hiểu con người – sẵn sàng dùng kiến thức để tạo tác động tích cực cho xã hội.
Hình ảnh minh họa, nguồn: Internet
Trong thời đại công nghệ số, Truyền thông Đa phương tiện không chỉ dừng lại ở việc sản xuất nội dung sáng tạo, mà còn là cầu nối giữa công nghệ, tâm lý học, marketing và các vấn đề thực tiễn của xã hội. Sinh viên ngành này được trang bị kiến thức liên ngành, kỹ năng nghiên cứu và tư duy chiến lược để tạo ra tác động tích cực trong nhiều lĩnh vực.
Một minh chứng tiêu biểu cho định hướng đào tạo này chính là nghiên cứu mới nhất của nhóm giảng viên ngành Truyền thông Đa phương tiện, Khoa Công nghệ Phần mềm – Trường Đại học Công nghệ Thông tin (ĐHQG-HCM). Công trình tập trung phân tích hành vi lựa chọn phương tiện giao thông “Xanh” (Metro) của giới trẻ TP. Hồ Chí Minh, dựa trên lý thuyết Kích thích – Chủ thể – Phản ứng (Stimulus – Organism – Response, SOR) trong tâm lý học truyền thông.
Kết quả nghiên cứu không chỉ giúp lý giải vì sao người trẻ chọn (hoặc chưa chọn) Metro thay cho xe cá nhân, mà còn đưa ra giải pháp chính sách và chiến lược truyền thông nhằm thúc đẩy xu hướng sử dụng phương tiện thân thiện môi trường. Công trình đã được công bố trên tạp chí Management of Environmental Quality – thuộc nhóm Scopus Q1 và ISI – khẳng định uy tín học thuật của đội ngũ giảng viên ngành.
Hình ảnh minh họa, nguồn: Internet
Điều này cho thấy, khi học Truyền thông Đa phương tiện tại UIT, sinh viên sẽ:
- Tiếp cận kiến thức đa ngành: kết hợp công nghệ, truyền thông, tâm lý học, và khoa học dữ liệu.
- Thực hành nghiên cứu và triển khai dự án thực tiễn giải quyết vấn đề xã hội.
- Phát triển tư duy chiến lược để thiết kế các chiến dịch truyền thông hiệu quả, từ marketing, truyền thông doanh nghiệp, đến truyền thông vì cộng đồng.
Ngành Truyền thông Đa phương tiện không chỉ mở ra cơ hội nghề nghiệp rộng lớn trong các công ty truyền thông, marketing, công nghệ, mà còn giúp sinh viên trở thành những người sáng tạo có trách nhiệm xã hội, sẵn sàng góp phần thay đổi cộng đồng theo hướng tích cực.
Link bài báo: https://dx.doi.org/10.1108/MEQ-12-2024-0600
- Details
Workshop #6 – Một số Xu hướng Thị giác Máy tính Hiện đại
Thời gian: 20h – 21h, ngày 15/08/2025
Hình thức: Online qua Google Meet
Người trình bày: TS. Nguyễn Duy Khánh
Link đăng ký & tham gia: https://meet.google.com/vvv-vvvo-fsf
Tiếp nối thành công của chuỗi Workshop Training Nghiên cứu Khoa học Sinh viên – Khoa Công nghệ Phần mềm, Workshop #6 sẽ đưa người tham dự khám phá một trong những lĩnh vực công nghệ tiên phong nhất hiện nay: Thị giác Máy tính (Computer Vision).
Trong thời đại AI bùng nổ, Thị giác Máy tính chính là “đôi mắt” của trí tuệ nhân tạo, giúp máy móc không chỉ nhìn thấy mà còn hiểu và hành động như con người. Từ robot tự hành, y tế thông minh đến metaverse và AI tạo sinh – mọi đột phá đều gắn liền với khả năng “nhìn” của máy.
Tại buổi workshop, bạn sẽ được dẫn dắt qua các chủ đề mới mẻ và đầy tiềm năng:
- Tổng quan & Xu hướng Thị giác Máy tính
Lộ trình phát triển từ CV truyền thống → Deep Learning → Vision Transformers → Foundation Models → Generative AI. - Foundation & Multimodal Models
Khám phá các mô hình tầm cỡ như ViT, CLIP, Segment Anything và sức mạnh xử lý đồng thời hình ảnh – văn bản – âm thanh. - Thị giác 3D
Các kỹ thuật SLAM, phát hiện & tái tạo vật thể 3D, ứng dụng trong AR/VR và robotics. - Vision-Language-Action
Mô hình kết hợp thị giác – ngôn ngữ – hành động cho robot và hệ thống tự hành. - Cơ hội Nghiên cứu & Ứng dụng
Ứng dụng trong y tế, giao thông thông minh, metaverse, AI tạo sinh và nhiều lĩnh vực đột phá khác.
Vì sao sinh viên không thể bỏ lỡ?
- Cập nhật xu hướng AI – CV hot nhất 2025
- Mở rộng kiến thức liên ngành & kỹ năng nghiên cứu khoa học
- Giao lưu và học hỏi trực tiếp từ TS. Nguyễn Duy Khánh và kết nối cộng đồng nghiên cứu AI
Link tham gia:
👉 https://meet.google.com/vvv-vvvo-fsf

- Details
Thời gian: 10:00, Thứ Năm — 07/08/2025
Địa điểm: Phòng E7.3, Khoa Công nghệ Phần mềm — Trường Đại học Công nghệ Thông tin (ĐHQG-HCM)
Bước vào thế giới AI đa phương thức: Khai phá sức mạnh truy vấn video thông minh
Từ hình ảnh đến ngôn ngữ, từ dữ liệu đến trí tuệ — buổi seminar cùng ThS. Quan Chí Khánh An đã mở ra hành trình khám phá Vision-Language Model, mang lại cảm hứng nghiên cứu và ứng dụng cho sinh viên ngành Kỹ thuật phần mềm.
Sáng 07/08/2025, tại phòng E7.3, Khoa Công nghệ Phần mềm tổ chức seminar học thuật với chủ đề “Xây dựng hệ thống truy vấn video dựa trên mô hình ngôn ngữ thị giác”. Buổi chia sẻ do ThS. Quan Chí Khánh An trình bày, với sự tham gia của rất nhiều Thầy Cô trong Khoa tham dự.
Trong thời đại dữ liệu hình ảnh và video tăng trưởng bùng nổ, ThS. Khánh An đã giúp người tham dự hiểu rõ cách Vision-Language Model kết nối hình ảnh với ngôn ngữ tự nhiên, các kỹ thuật tiên tiến như contrastive learning, embedding alignment, và quy trình xây dựng hệ thống truy vấn video thông minh. Những ví dụ sinh động từ nghiên cứu thực tế đã biến lý thuyết phức tạp thành những ý tưởng dễ hình dung và đầy cảm hứng.
Không chỉ là buổi học thuật, seminar này còn là lời mời gọi bước chân vào thế giới AI đa phương thức, nơi sinh viên Kỹ thuật phần mềm có thể hiện thực hóa những giải pháp công nghệ đột phá.
Ngành Kỹ thuật phần mềm — Bệ phóng cho đam mê công nghệ
Tại Khoa Công nghệ Phần mềm — UIT, ngành Kỹ thuật phần mềm trang bị cho sinh viên:
- Nền tảng lập trình vững vàng, tư duy hệ thống.
- Khả năng thiết kế, phát triển và tối ưu sản phẩm phần mềm.
- Kiến thức và kỹ năng ứng dụng AI, xử lý ngôn ngữ tự nhiên, xử lý hình ảnh & video.




Với môi trường học tập năng động, gắn liền thực tiễn và nghiên cứu, đây là nơi để những bạn trẻ đam mê công nghệ viết nên câu chuyện thành công của riêng mình.
VI
EN