وبینار دوره جامع پروژه محور علم داده با پایتون
شروع وبینار: 20 تیر 02 – ساعت 19:00
دوره جامع پروژه محور علم داده در پایتون(محوریت داده کاوی-یادگیری ماشین-یادگیری عمیق در NLP)مباحث جدید ترنسفورمرها-gpt – bert بر اساس سرفصل دوره های udemyشروع دوره از 20 تیرماه تا 22 مردادماه (20 ساعت) – یکشنبه ها و سه شنبه ها از ساعت 19 الی 21
با پشتیبانی و امکان ارتباط با مدرس -تشکیل گروه تلگرامی و ارتباط با سایر اعضا
مدرس دوره: مهندس مینا سادات ربطی
ارتباط و مشاوره رایگان : 09029070835
اینستاگرام : minarabti
کانال یوتیوب(آموزش های رایگان) : mina rabti
کارشناس علم داده و مدرس دوره های داده کاوی با سابقه اجرایی پروژه های یادگیری ماشین و تحلیل داده
سوابق کاری و تدریس
- مدرس جهاد دانشگاهی و دانشگاه آزاد البرز به مدت 3 سال
- مدرس دوره های داده کاوی و متن کاوی با پایتون به مدت 8 سال در باشگاه هوش تجاری
- مدرس دوره کاوی با پایتون و یادگیری عمیق : کمپ پروژه محور علم داده-آکادمی ساینس ویو
- مدرس دوره یادگیری ماشین در انرژی : گروه آپ گرین گرید-تیم تخصصی بهینه سازی انرژی
- ارائه خدمات مشاوره داده کاوی در بیمه ملت
- تحلیل گر داده در باشگاه هوش تجاری و شرکت دانش بنیان بتا
- کسب مقام اول (پژوهشگر برتر) کنفرانس هوش تجاری و کاربردی سازی
- دیتا ساینتیست در آلین لند
سایر دوره های برگزار شده مدرس و آکادمی : دوره کاربردی و پروژه محور داده کاوی و یادگیری ماشین در پایتون با شرکت 40 دانشجو : لینک و سرفصل دوره
دوره سری زمانی عملی با یادگیری عمیق در پایتون با شرکت 35 دانشجو : لینک و سرفصل دوره
تلاش ما در این دوره آن است که با آموزش جدیدترین پروژه های کاربردی یادگیری ماشین و یادگیری عمیق در مسیر تخصصی دیتا ساینس در کنار شما باشیم .
پروژه هایی که در این دوره صفر تا صد کار می کنیم :
دوره داده کاوی و یادگیری ماشین ( این دوره به صورت آفلاین است و به محض ثبت نام فیلم های کامل دوره به هرماه فایل ها برای شما ارسال خواهد شد)
- پاکسازی داده های تشخیص بیماری قلبی
- طبقه بندی مشتریان ریزش یافته یک شرکت خدمات دهنده ایرانی(صفر تا صد از پاکسازی تا مدلسازی)
- پیش بینی قیمت خانه با مدلهای رگرسیون صفر تا صد از پاکسازی تا مدلسازی)
- خوشه بندی مشتریان بیمه مسوولیت یک شرکت ایرانی با رویکرد RFM در پایتون
- تحلیل سبد خرید محصولات لوازم خانگی پارس خزر با قواعد انجمنی
دوره یادگیری عمیق
- تحلیل احساسات نظرات مشتریان دیجی کالا (محصولات عطر و ادکلن): زبان فارسی: روشهای یادگیری ماشین sklearn,hazm,nltk
- خلاصه سازی متون با مدلهای huggingFace,bert,lex,lsa
- طبقه بندی متون (سایت imdb) روشهای دیپ لرنینگ و Transformer,bert ,gpt
- مدلسازی موضوع خبری( خوشه بندی) با ابزار gensim
سرفصلهای وبینار
دوره پروژه محور داده کاوی و یادگیری ماشین در پایتون(فیلم ضبط شده): 30 ساعته
مبحث اول : مقدمات داده کاوی، یادگیری ماشین
مبحث دوم : تحلیل اکتشافی داده(EDA) : انواع نمودارها و نکات تحلیلی شناخت داده ها
مبحث سوم: پاکسازی داده ها(data Cleaning) و مدیریت داده پرت و از دست رفته در پایتون
مبحث چهارم: نرمالسازی و گسسته سازی داده ها(Data transformation) در پایتون
مبحث پنجم : آماده سازی داده(data preparation) : مهندسی ویژگی-انتخاب ویژگی در پایتون
مبحث ششم: فاز مدلسازی(طبقه بندی) : طبقه بندی ریزش مشتریان روی داده ایرانی (شرکت خدمات اینترنتی): از پاکسازی تا مدلسازی
- مفاهیم یادگیری ماشین
- DecisionTree, Knn,Svm,NaiveBeyes,ANN,MLp
- Logistic Regression
- بیش برازش(Overfitting) و کم برازش(Under Fitting) و روشهای برخورد با آن
- Cross validation
- تکنیک های جمعی (Ensemble Learning )
- Random forest,stacking,vooting
- مفاهیم الگوریتم ها، هایپر پارامترهای هر مدل با فرمول ریاضی
- کدنویسی الگوریتم در پایتون
مبحث هفتم: فاز مدلسازی(رگرسیون و پیش بینی) : پروژه پیش بینی قیمت خانه در پایتون
- آشنایی با روش رگرسیون خطی و چندگانه Linear Regression: Least-Squares
- Linear Regression: Ridge, Lasso, and Polynomial Regression
- روش Regression Tree، Mlp Regressor و SVR و KNNRegressor
مبحث هشتم : فاز ارزیابی مدل های طبقه بندی و رگرسیون(Model Evaluation)
- ماتریس در همریختگی(Confusion Matrix)
- معیار کارایی مدل ها: دقت کل) (Accuracyو کارایی آن
- معیار کارایی مدل ها: دقتهای تحلیل حساسیت(recall & Precision)
- ROC curves
- پارامترهای ارزیابی MSE، وMAE و R2 و RMSE (Regression Evaluation)
مبحث نهم : فاز خوشه بندی clustering(یادگیری بدون ناظر): خوشه بندی روی داده ایرانی شرکت بیمه : گروه بندی مشتربان
- سگمنت بندی(clustering) و کاربردهای آن
- روش های مبتنی بر تراکم (Density-Based Methods)
- روشهای پارتیشن بندی (Partition methods)
- روشهای سلسله مراتبی (Hierarchical methods)
- روش kmeans و بهینه سازی تعداد خوشه ها
- روش DbScan
- کدنویسی مدل خوشه بندی روی داده شرکت بیمه
- آشنایی با مدل RFM در تحلیل بازار و مشتریان
- پارامترهای ارزیابی خوشه بندی Silhouette، Davis bouldin
مبحث دهم : فاز قواعد انجمنی Association Rule Mining (یادگیری بدون ناظر)
- قواعد انجمنی Association Rule Mining
- قوانین پرتکرار Frequent Itemset و روشهای تحلیل سبد خرید
- Frequent Itemset Generation
- روش APriori Illustrating Apriori Principle و مفاهیم آن با مثال
- کدنویسی پروژه تحلیل سبد خرید
دوره آنلاین پروژه محور پردازش متن(NLP) با یادگیری عمیق و ترنسفورمرها: 20 ساعته
مبحث اول(مقدمه): مبانی NLp و کاربرد پردازش زبان طبیعی
مبحث دوم: کیت ابزارهای پردازش متن(-transformerNltk-spacyو …) – نصب ابزارها(ژوپیتر نوتبوک و گوگل کولب)
مبحث سوم: استخراج متن (Txt,Pdf,html,..)
مبحث سوم: پیش پردازش متن (nltk-spacy) و مقایسه دو کتابخانه
- حذف علایم نگارشی(Removing Punctuation)
- توکن کردن جملات و کلمات (Tokenize)
- حذف کلمات اضافه (stopwords)
- corpus,wordNet
- stemming, lemmitization(ریشه کلمات)
- pos-tag-N-grams
- NER : تشخیص نهاد نامگذاری شده
مبحث چهارم : آشنایی با عبارات منظم در پایتون RegEx
مبحث پنجم : استخراج ویژگی با CountVectorizer, TF-IDF, word2vec
مبحث ششم(پروژه اول:) تحلیل احساسات (نظرکاوی) روی داده محصولات دیجی کالا-پردازش زبان فارسی)
- کتابخانه hazm و fattext
- پیش پردازش مجموعه داده متنی
- استخراج ویژگی(Count Vectorization)
- انتخاب ویژگی با pca
- تحلیل احساسات با مدل شبکه عصبی و نایوبیز
- دقت مدل و ارزیابی
مبحث هفتم(پروژه دوم) طبقه بندی متن (مجموعه داده imdb) با ترنسفورمرها
- الگوریتم های بازگشتی یادگیری عمیق(LSTM-RNN-GRu )
- پردازش زبان طبیعی با الگوریتم های بازگشتی و چالش
- ترنسفورمرها در تولید-تاریخچه مدل transformer
- چالش و راه حل- مدل BERT
- یادگیری انتقالی
- نمای کلی معماری ترنسفورمرها
- مدل bert و نشانه گذاری
- مکانیزم توجه به خود
- مجموعه داده imdb
- پیش پردازش در ترنسفورمرها
- طبقه بندی متن
مبحث هشتم(پروژه سوم) خلاصه سازی متن
- text summerization with sumy
- text summerization with HuggingFace
- مقایسه دو مدل
مبحث نهم(پروژه چهارم) مدلسازی موضوع(خوشه بندی متون خبری) با gensim
- مقدمه ای بر topic modeling
- پیش پردازش داده خبری( cleaning-tfidf-corpus)
- مدلسازی موضوع با Latent Semantic Analysis (LSA)
- مدلسازی موضوع با Latent Dirichlet Allocation (LDA)
- مصور سازی مدل با pyLDAvis
برای اطلاعات بیشتر و ثبت نام کلیک کنید. هنگام ثبت نام 20% تخفیف با کد تخفیف vanda
دیدگاهتان را بنویسید