پردازش زبان طبیعی یعنی مطالعه روی درک رایانهها از گفتار، نوشتار، و ارتباط انسانی. رایانهها با مجهز شدن به این درک، میتوانند تحلیل احساسی یا دیگر تحلیلهای متنی را در مقیاس بزرگ انجام دهند و دادههای معنادار فراهم آورند. NLP جزئی از هوش مصنوعی است.
توسعهی برنامههای NLP کار سختی است چرا که از قدیم لازم بوده که انسان با رایانه از طریق یک زبان برنامهنویسی دقیق، نامبهم و بسیار ساختاریافته، مانند جاوا، ++C و روبی و یا از طریق تعداد محدودی دستور صوتی با تلفظ واضح «سخن بگوید»، ولی گفتار انسانی همیشه هم دقیق نیست – اغلب مبهم است و ساختار زبانی آن ممکن است به متغیرهای پیچیدهی بسیاری از جمله زبان عامیانه، گویشهای محلی، و پسزمینهی اجتماعی وابسته باشد. انسانها آنگونه که با رایانه سخن میگویند با یکدیگر حرف نمیزنند.
«زبان برنامه نویسی پایتون» (Python Programming Language)، زبانی با یادگیری آسان محسوب میشود و از همین رو بسیاری از برنامهنویسهای تازهکار آن را به عنوان اولین زبان برنامهنویسی خود برمیگزینند، زیرا پایتون به عنوان یک «زبان همهمنظوره» (General-Purpose Language) ساخته و توسعه داده شده و محدود به توسعه نوع خاصی از نرمافزارها نیست. به بیان دیگر، میتوان از آن برای هر کاری، از «تحلیل داده» (Data Analysis) گرفته تا ساخت بازیهای کامپیوتری استفاده کرد.
سرفصل های دوره آموزشی Udemy Data Science: Natural Language Processing (NLP) in Python:
- پردازش زبان طبیعی – چه چیزی برای آن استفاده می شود؟
- آمادگی دوره
- ساخت آشکارساز اسپم خود
- ساخت تحلیلگر احساسات خود
- اکتشاف NLTK
- تجزیه و تحلیل معنایی نهان
- نوشتن مقاله خود را به چرخ دنده
- چگونگی کسب اطلاعات بیشتر در مورد NLP
- بررسی مبانی یادگیری ماشین
- ضمیمه