Xử Lý Ngôn Ngữ Tự Nhiên - Deep Learning | NLP

Xử Lý Ngôn Ngữ Tự Nhiên - Deep Learning | NLP

Xử Lý Ngôn Ngữ Tự Nhiên - Deep Learning | NLP

45 260 LƯỢT XEM

NỘI DUNG MÔN HỌC

Khóa học này tập trung vào việc áp dụng Deep Learning trong lĩnh vực Xử lý Ngôn ngữ Tự nhiên (NLP). Học viên sẽ được học các kỹ thuật xử lý văn bản, các mô hình neural network cho NLP, và cách áp dụng chúng vào các bài toán NLP thực tế. Khóa học kết hợp lý thuyết với thực hành, giúp học viên xây dựng các ứng dụng NLP từ cơ bản đến nâng cao..

Nội dung được thiết kế để xây dựng trên nền tảng kiến thức từ khóa học Deep Learning trước đó, đồng thời cung cấp kiến thức chuyên sâu về Deep Learning cho NLP.

Thời lượng: 45 giờ

Sau khi hoàn thành khóa học, học viên có khả năng:
  • Nắm vững các kỹ thuật xử lý ngôn ngữ tự nhiên cơ bản và nâng cao
  • Hiểu và áp dụng được các mô hình Deep Learning cho NLP như RNN, LSTM, GRU, và Transformer
  • Thành thạo việc sử dụng các thư viện NLP phổ biến như NLTK, spaCy, và Hugging Face Transformers
  • Có khả năng xây dựng và triển khai các ứng dụng NLP như phân loại văn bản, dịch máy, và tạo sinh văn bản
  • Hiểu và áp dụng được các kỹ thuật tiên tiến như Transfer Learning và Fine-tuning trong NLP
  • Học viên sẽ được cấp chứng nhận hoàn tất khóa học theo quy định của ITSTARVN.
Nội dung khóa học
Cơ sở NLP và Xử lý Văn bản (8 giờ)
  • Bài 1: Giới thiệu về NLP và các thách thức (2 giờ)
    • Tổng quan về NLP và ứng dụng
    • Các thách thức trong xử lý ngôn ngữ tự nhiên
    • Giới thiệu các thư viện NLP: NLTK, spaCy
  • Bài 2: Tiền xử lý văn bản (3 giờ)
    • Tokenization và Word Segmentation
    • Loại bỏ stopwords và punctuation
    • Stemming và Lemmatization
    • Bài tập thực hành: Xây dựng pipeline tiền xử lý văn bản
  • Bài 3: Biểu diễn văn bản (3 giờ)
    • One-hot encoding
    • Bag of Words (BoW) và TF-IDF
    • N-grams
    • Bài tập thực hành: So sánh hiệu quả của các phương pháp biểu diễn văn bản
Word Embeddings và Language Models (10 giờ)
  • Bài 4: Word Embeddings (3 giờ)
    • Giới thiệu về Word Embeddings
    • Word2Vec (CBOW và Skip-gram)
    • GloVe và FastText
    • Bài tập: Huấn luyện và trực quan hóa word embeddings
  • Bài 5: Các kỹ thuật nâng cao trong Word Embeddings (3 giờ)
    • Subword embeddings
    • Contextual word embeddings (ELMo)
    • Sentence và Document embeddings
    • Bài tập: So sánh hiệu quả của các loại embeddings trong bài toán phân loại văn bản
  • Bài 6: Language Models (4 giờ)
    • N-gram Language Models
    • Neural Language Models
    • Ứng dụng của Language Models
    • Dự án mini: Xây dựng một Language Model đơn giản để sinh văn bản
Recurrent Neural Networks cho NLP (10 giờ)
  • Bài 7: RNN cơ bản và ứng dụng trong NLP (3 giờ)
    • Kiến trúc RNN và backpropagation through time
    • Vanishing và exploding gradient trong RNN
    • Ứng dụng RNN trong sequence labeling (POS tagging, NER)
  • Bài 8: LSTM và GRU (3 giờ)
    • Kiến trúc LSTM và GRU
    • So sánh LSTM, GRU với RNN cơ bản
    • Bidirectional và Multi-layer RNNs
  • Bài 9: Seq2Seq và Attention (4 giờ)
    • Kiến trúc Encoder-Decoder
    • Cơ chế Attention
    • Ứng dụng trong Machine Translation và Text Summarization
    • Dự án: Xây dựng mô hình dịch máy đơn giản với Seq2Seq và Attention
Transformer và BERT (12 giờ)
  • Bài 10: Kiến trúc Transformer (3 giờ)
    • Self-Attention và Multi-Head Attention
    • Position Encoding
    • Feed-Forward Networks trong Transformer
  • Bài 11: BERT và các mô hình tiền huấn luyện (3 giờ)
    • Giới thiệu về BERT
    • Quá trình tiền huấn luyện và fine-tuning
    • Các biến thể của BERT (RoBERTa, DistilBERT, ALBERT)
  • Bài 12: Ứng dụng BERT trong các tác vụ NLP (3 giờ)
    • Fine-tuning BERT cho phân loại văn bản
    • Question Answering với BERT
    • Named Entity Recognition với BERT
  • Bài 13: Hugging Face Transformers (3 giờ)
    • Giới thiệu về thư viện Hugging Face Transformers
    • Sử dụng pre-trained models
    • Fine-tuning models cho các tác vụ cụ thể
    • Dự án: Xây dựng ứng dụng phân tích sentiment sử dụng BERT và Hugging Face
Các chủ đề nâng cao và xu hướng mới trong NLP (5 giờ)
  • Bài 14: Transfer Learning trong NLP (2 giờ)
    • Nguyên lý của Transfer Learning trong NLP
    • Few-shot và Zero-shot Learning
    • Ứng dụng Transfer Learning trong các bài toán NLP thực tế
  • Bài 15: Xu hướng mới trong NLP (3 giờ)
    • GPT và các mô hình ngôn ngữ lớn
    • Multimodal Learning trong NLP
    • Ethical AI và Bias trong NLP
    • Thảo luận: Tương lai của NLP và AI

 

/* Nội dung chương trình có thể thay đổi theo yêu cầu đào tạo của Doanh nghiệp */
------------------------------------
Điện thoại liên hệ khóa học tại itstar.edu.vn

090.999.4327 | Mr. David Dang

Email liên hệ khóa học tại itstar.edu.vn

admin@itstar.vn