ডেটা এবং ফিনান্সিয়াল অ্যানালিটিক্সের জন্য আমার পাইথন শেখার যাত্রা (লার্নিং পাথ/মডিউল)

Nafis Zaki
Python Data Analytics Tutorial Learning Path

এটি একটি “ধাপে ধাপে পাইথন শেখার টিউটোরিয়াল”। বিশেষভাবে আর্থিক/ডেটা বিশ্লেষক/অ্যাকাউন্টিং পেশা এবং যারা দেখে শিখতে পছন্দ করেন তাদের জন্য তৈরি। এটি আমাকে কার্যকরভাবে পাইথন শিখতে সাহায্য করেছে, আশা করি এটি আপনাকেও সাহায্য করবে।

ধাপে ধাপে নির্দেশাবলী

পাইথন এবং প্রোগ্রামিং বেসিক, নাম্পাই (NumPy), পান্ডাস (ডেটা ম্যানিপুলেশন), বিভিন্ন ধরণের ডেটা বিশ্লেষণ, প্লটলি এক্সপ্রেস (ভিজ্যুয়ালাইজেশন), কাজের অটোমেশন এবং ওয়েব স্ক্র্যাপিং শিখুন।

১. VS Code ডাউনলোড করা

VS Code/Cursor/Anti Gravity ইত্যাদি যেকোনো কোড এডিটর যা আপনি পছন্দ করেন তা ডাউনলোড করুন। আমি VS Code পছন্দ করি, তাই আমি তাদের ইনস্টলেশন লিঙ্ক সংযুক্ত করছি।

দ্রষ্টব্য: উইন্ডোজ ব্যবহারকারীদের জন্য, এমএস উইন্ডোজ স্টোর থেকে VS Code বা পাইথন ইনস্টল করলে ভবিষ্যতে অনেক সমস্যা তৈরি হয়, তাই আমি আপনাকে তা এড়ানোর পরামর্শ দেব।

২. পাইথন ইনস্টল করা

তাদের অফিসিয়াল সোর্স লিঙ্ক থেকে পাইথন ইনস্টল করুন।

৩. ভার্চুয়াল এনভায়রনমেন্ট (Virtual Environments)

এই ভিডিওটি দেখা এবং কীভাবে একটি পাইথন ভার্চুয়াল এনভায়রনমেন্ট সেট আপ করতে হয় তা শেখা।

এই ভিডিওটি একটু কঠিন মনে হতে পারে, তবে যেকোনো পাইথন কোর্স বা অন্যান্য ভিডিও শুরু করার আগে ভার্চুয়াল এনভায়রনমেন্ট শুরু করতে শেখাটা গুরুত্বপূর্ণ (আমার মনে হয়)। ভিডিও লিঙ্ক:

৪. পাইথন বেসিকস (Python Basics)

Bro Code থেকে আপডেটেড পাইথন বেসিকস টিউটোরিয়ালটি দেখা। ৯ ঘণ্টা ২০ মিনিট পর্যন্ত। তিনি যে সমস্ত গেম এবং অনুশীলন দেন তা তার দেওয়া সমাধান দেখার আগে নিজে থেকে আলাদাভাবে অনুশীলন করা উচিত। ইউডেমি (Udemy), কোর্সেরা (Coursera) এবং ইউটিউব (YouTube) খোঁজার পর এটিই আমি সবচেয়ে পরিষ্কার পাইথন টিউটোরিয়াল পেয়েছি।

এই ভিডিও থেকে, আপনার নিচের পাইথন ক্যানভাসে বর্ণিত মৌলিক ধারণাগুলো শিখতে হবে। এই ক্যানভাসের রূপরেখা অনুসরণ করা আপনাকে কীভাবে সবকিছু একসাথে সংযুক্ত হয় সে সম্পর্কে একটি পরিষ্কার ভিজ্যুয়াল ধারণাও দেবে।

৫. নাম্পাই এবং পান্ডাস (NumPy and Pandas)

এরপর, আমরা আর্থিক এবং ব্যবসায়িক বিশ্লেষক হিসেবে পাইথন ব্যবহারের খুঁটিনাটি এবং প্যাকেজগুলোতে প্রবেশ করব। আমরা আইবিএম (IBM)-এর এই কোর্সটি অনুসরণ করব। আমরা চাইলে এখানে সার্টিফিকেশনও অর্জন করতে পারি, তবে তা ঐচ্ছিক এবং প্রয়োজনীয় নয়।

এই কোর্স থেকে শুধুমাত্র মডিউল ৪ এবং মডিউল ৫ শিখুন, আগের মডিউলগুলো উল্লিখিত ভিডিওগুলোতে আরও ভালোভাবে ব্যাখ্যা করা হয়েছে।

https://cognitiveclass.ai/courses/python-for-data-science

শেখার লক্ষ্য: নাম্পাই (NumPy) এবং পান্ডাস (Pandas)

যদি আপনি মনে করেন যে এই ২টি মডিউল পান্ডাস শেখার জন্য যথেষ্ট ছিল না এবং শুধুমাত্র যদি আপনি তা মনে করেন, তবে, অ্যালেক্স দ্য অ্যানালিস্ট (Alex the Analyst)-এর এই প্লেলিস্টটি যথেষ্ট হবে:

https://www.youtube.com/watch?v=dUpyC40cF6Q&list=PLUaB-1hjhk8GZOuylZqLz-Qt9RIdZZMBE

৬. তাত্ত্বিক কঠোরতা এবং দক্ষতা পরীক্ষা

এরপর, একটু বেশি থিওরি ভিত্তিক শেখা, যা সম্পর্কে আমাদের ইতিমধ্যেই কিছু ধারণা আছে, তাই এটি খুব কঠিন হবে না। মূলত, আমরা পাইথনের মাধ্যমে ডেটা অ্যানালিটিক্সের জন্য ব্যবহার করি এমন কিছু মূল উপাদান শিখব।

https://cognitiveclass.ai/courses/data-analysis-python

সব মডিউল প্রয়োজনীয়। সার্টিফিকেশনও সম্ভব।

আমরা যে ৬টি উপাদান শিখেছি সে পর্যন্ত আপনার দক্ষতা পরীক্ষা করার জন্য, ফ্রি-কোড-ক্যাম্প (FreeCodeCamp)-এ ডেটা অ্যানালিটিক্সে সার্টিফিকেশন পাওয়ার জন্য প্রয়োজনীয় বিনামূল্যের কাজগুলো (tasks) করুন।

https://www.freecodecamp.org/learn/data-analysis-with-python/

এটি একটি প্রয়োজনীয় পদক্ষেপ। উপেক্ষা করা উচিত নয়।

৭. প্লটলি দিয়ে ভিজ্যুয়ালাইজেশন (Visualization With Plotly)

অভিনন্দন, আপনি পাইথন ব্যবহার করে ডেটা অ্যানালিটিক্স করার একদম প্রাথমিক বিষয়গুলো শিখে ফেলেছেন। কিন্তু এখন আপনি আপনার অ্যানালিটিক্স দক্ষতা প্রদর্শন করতে চান, কারণ হাজার শব্দের চেয়ে একটি ছবি ভালো। সুতরাং, আমরা তা শিখব, আমরা প্লটলি এক্সপ্রেস (Plotly Express) শিখব। এছাড়াও, আপনি যদি সব পরিস্থিতিতে সম্পূর্ণ প্রস্তুত থাকতে চান তবে ম্যাটপ্লটলিব (Matplotlib) এবং সির্ন (Seaborn)-ও শিখতে পারেন।

কিন্তু, আপনি এখনও শেখার জন্য প্রয়োজনীয় মূল দিকগুলোর মধ্যে একটি তৈরি করেননি। তা হলো, ডকুমেন্টেশন পড়া এবং কোনো টিউটোরিয়াল আপনাকে স্পষ্টভাবে পরিচালনা করা ছাড়াই আপনি যে পরিস্থিতির মুখোমুখি হচ্ছেন এবং যে লাইব্রেরি নিয়ে কাজ করছেন তার উপর ভিত্তি করে সমস্যার সমাধান করা।

সুতরাং, এই দুটি লক্ষ্য মাথায় রেখে, আমরা প্লটলি এক্সপ্রেসের ডকুমেন্টেশন ব্যবহার করব, যা অত্যন্ত স্পষ্টভাবে নথিভুক্ত এবং সুন্দরভাবে লেখা।

ম্যাটপ্লটলিবের বিপরীতে প্লটলি এক্সপ্রেস ব্যবহার করে একটি ভালো ভিজ্যুয়াল পাওয়া বেশ সহজ। তাই, আমরা তা দিয়ে শুরু করব:

https://plotly.com/python/plotly-express/

এই লিঙ্কে যান। এই লিঙ্কে, কিছু মৌলিক ভিজ্যুয়ালাইজেশন কৌশল এইভাবে তালিকাভুক্ত করা হয়েছে:

-Basics: scatter, line, area, bar, funnel, timeline

-Part-of-Whole: pie, sunburst, treemap, icicle, funnel_area

-1D Distributions: histogram, box, violin, strip, ecdf

…চলবে

প্রতিটি লিঙ্কে ক্লিক করুন এবং আপনার নিজের গতিতে সেগুলোর প্রতিটি কীভাবে তৈরি করবেন তা শিখুন এবং প্লটলি আপনাকে যে ডিফল্ট ডেটাসেট উদাহরণ দেয় তার পাশাপাশি আপনার কাছে ইতিমধ্যে থাকা যেকোনো ডেটাসেট তৈরি/ব্যবহার করে নিজেকে চ্যালেঞ্জ করুন।

যদি আপনি প্লটলি (প্লটলি এক্সপ্রেসের বস) সম্পর্কে আরও শিখতে চান, তবে এটি আপনাকে সাহায্য করবে:

https://www.youtube.com/watch?v=GGL6U0k8WYA&t=241s

এখন, যদিও প্লটলি (এবং এর সংক্ষিপ্ত সংস্করণ প্লটলি এক্সপ্রেস এবং উপরেরটি) পাইথনে ডেটা ভিজ্যুয়ালাইজেশনের জন্য প্রায় সম্পূর্ণ প্যাকেজ, তবুও বেশিরভাগ কোর্স এবং অন্যান্য ব্যবহারকারীরা দুটি খুব ভিন্ন লাইব্রেরির সাথে বেশি পরিচিত। ম্যাটপ্লটলিব (Matplotlib) এবং সির্ন (Seaborn) (যা ম্যাটপ্লটলিবকে ভিত্তি হিসেবে ব্যবহার করে)।

সুতরাং, আপনি হয়তো এটি শিখে রাখতে চাইবেন। এটি আরও জটিল হতে চলেছে কারণ ম্যাটপ্লটলিব ‘আনপাইথনিক’ (unpythonic) এবং আসলে ম্যাট ল্যাব (MATLAB)-এর ভাষার কাঠামোর বেশি কাছাকাছি। কিন্তু, আর কি করা। কি আর করা যাবে।

https://cognitiveclass.ai/courses/data-visualization-python

উপরের কোর্সের সমস্ত মডিউল অনুসরণ করুন এবং সির্ন (Seaborn)-এর পরিষ্কার ধারণার জন্য, নিচের কোর্সটি অনুসরণ করুন:

https://www.youtube.com/watch?v=6GUZXDef2U0

এটি যথেষ্ট হওয়া উচিত।

৮. ওয়েব স্ক্র্যাপিং এবং অটোমেশন

আমরা প্রায় শেষ করে ফেলেছি! আমাদের শুধু কিছু শূন্যস্থান পূরণ করতে হবে যা আমাদের থাকতেও পারে আবার নাও থাকতে পারে। সুতরাং, আমাদের কিছু স্ক্র্যাপিং করার প্রয়োজন হতে পারে (এখন পর্যন্ত, আমাদের “requests” লাইব্রেরির সাথে পরিচিত হওয়া উচিত) এবং এ ব্যাপারে কিছু ডেডিকেটেড সাহায্যের প্রয়োজন হতে পারে। তাই, আমরা বিউটিফুলস্যুপ (beautifulsoup) এবং রিকোয়েস্টস (requests) সম্পর্কে আরও বিস্তারিত জানব। এর জন্য, এই ভিডিওটি:

https://www.youtube.com/watch?v=XVv6mJpFOb0

যদি আমাদের পাইথন সম্পর্কিত জিনিসের জন্য মেশিন লার্নিং এবং সম্পর্কিত জ্ঞানের প্রয়োজন হয়, তবে নিচের কোর্সটি শুরুর পয়েন্ট হিসেবে কাজ করতে পারে:

https://cognitiveclass.ai/courses/machine-learning-with-python

যদি আপনি খুব ফিনান্সিয়াল এবং অন্যান্য বিশ্লেষণ ভিত্তিক ব্যক্তি হতে চান, তবে মনটে কার্লো সিমুলেশন (Monte Carlo Simulation), পাইথন ব্যবহার করে অপ্টিমাল পোর্টফোলিও তৈরি করার বিষয়ে ম্যাথিউ উইলিয়াম রোসেনার, সিএফএ (Matthew William Roesener, CFA)-এর কিছু প্লেলিস্ট সহায়ক হতে পারে, কিন্তু এখন পর্যন্ত, এই কাজগুলো নিজে করার জন্য আপনার যথেষ্ট পাইথন জ্ঞান থাকা উচিত।

https://www.youtube.com/@matthewroesener/playlists

যদি আপনি প্রতিদিনের কাজগুলো অটোমেট করতে চান এবং কীভাবে তা করতে হয় সে সম্পর্কে ধারণা পেতে চান, তবে আপনি নিচের ২টি ভিডিও দেখতে পারেন

https://www.youtube.com/watch?v=PXMJ6FS7llk

https://www.youtube.com/watch?v=s8XjEuplx_U

এছাড়াও, যে প্রক্রিয়াটি আপনাকে নিয়মিত করতে হয় এবং অনেক সময় নেয়, আপনি চেষ্টা করলে সম্ভবত তা নিজেই অটোমেট করতে পারবেন।

এগুলোই কিছু বিশেষ ক্ষেত্র যা কেউ তাদের কর্মক্ষেত্রে মুখোমুখি হতে পারে বলে আমি মনে করতে পারি। আপনি এখন আপনার নিজের অনুসন্ধান চালাতে পারেন এবং আপনার শেখার যাত্রাকে নিজের মতো করে কাজে লাগাতে পারেন।

প্রজেক্ট তৈরি করতে থাকুন, ব্যবহার করুন

অভিনন্দন! আপনি এখন আপনার ডেটা বিশ্লেষণ যাত্রার জন্য প্রতিদিনের ড্রাইভার হিসেবে পাইথন ব্যবহার করার জন্য প্রয়োজনীয় প্রায় সমস্ত দিক পূরণ করেছেন।

এখন, আসুন কিছু “রিচিং গোল” (reaching goals) বা অতিরিক্ত লক্ষ্য নিয়ে কথা বলি, যে লক্ষ্যগুলো সম্ভবত আপনার পাইথন বা অন্যান্য জিনিসের জন্য প্রয়োজন হবে না, তবে থাকলে ভালো।

৯. অন্যান্য ভালো দক্ষতা (Other Nice to Have Skills)

(i) এসকিউএল শেখা (Learning SQL)। এসকিউএল অবিশ্বাস্যভাবে সহায়ক, অবিশ্বাস্যভাবে। তাই, এটি আপনার সময়ের উপযুক্ত হতে পারে।

https://youtu.be/ztHopE5Wnpc?si=GTS2T8VSjF6r3y1v

উপরের ভিডিওটি আপনাকে এসকিউএল সম্পর্কে একটি ধারণাগত কাঠামো দেবে।

এবং নিচের ভিডিওটি আপনাকে এমএস এসকিউএল সার্ভারে (MS Sql Server) কাজ করার একটি পাঠ দেবে:

https://www.youtube.com/watch?v=LGTbdjoEBVM

ডেটাবেস স্টারের (Database Star) ডেটাবেস ডিজাইন সম্পর্কিত নিচের প্লেলিস্টটি আপনাকে বিভিন্ন ধরণের ডেটাবেস কীভাবে তৈরি/গঠন/কাজ করতে হয় সে সম্পর্কে ধারণা দেবে:

https://www.youtube.com/watch?v=-C2olg3SfvU&list=PLZDOU071E4v6epq3GS0IqZicZc3xwwBN_

এছাড়াও, ডকারে তার ডেটাবেস সেটআপ সম্পর্কিত প্লেলিস্টটি আমার জন্য অবিশ্বাস্যভাবে সহায়ক ছিল। নিচে দেওয়া হলো:

https://www.youtube.com/watch?v=OTglm9fVCL4&list=PLZDOU071E4v7UbgZMsnn5SZvk1GIAuLcX

(ii) আপনার ক্যারিয়ারের জন্য পাওয়ার বিআই (PowerBI)/ট্যাবলো (Tableau) এবং এর কিছু শেখাও অবিশ্বাস্যভাবে মূল্যবান হতে পারে।

এর জন্য, বিশেষ করে কিছু মাইক্রোসফ্ট পাওয়ার টুলস সম্পর্কিত এই প্লেলিস্টটি আপনার জন্য সহায়ক হতে পারে:

https://www.youtube.com/watch?v=ja68xMpabQA&list=PLrRPvpgDmw0lAIQ6DPvSe_hfAraNhTvS4

যেহেতু আপনি ইতিমধ্যে একটি প্রোগ্রামিং ভাষা শিখেছেন, তাই ডকুমেন্টেশন এবং অন্যান্য জিনিস পড়ে নিজে নিজে পাওয়ার বিআই নেভিগেট করা আপনার জন্য খুব কঠিন হবে না।

আমি আসলে ট্যাবলো ব্যবহার করিনি তবে আমি ধরে নিচ্ছি এটি পাওয়ার বিআই থেকে খুব বেশি আলাদা হবে না।