ডেটা এবং ফিনান্সিয়াল অ্যানালিটিক্সের জন্য আমার পাইথন শেখার যাত্রা (লার্নিং পাথ/মডিউল)
এটি একটি “ধাপে ধাপে পাইথন শেখার টিউটোরিয়াল”। বিশেষভাবে আর্থিক/ডেটা বিশ্লেষক/অ্যাকাউন্টিং পেশা এবং যারা দেখে শিখতে পছন্দ করেন তাদের জন্য তৈরি। এটি আমাকে কার্যকরভাবে পাইথন শিখতে সাহায্য করেছে, আশা করি এটি আপনাকেও সাহায্য করবে।
ধাপে ধাপে নির্দেশাবলী
পাইথন এবং প্রোগ্রামিং বেসিক, নাম্পাই (NumPy), পান্ডাস (ডেটা ম্যানিপুলেশন), বিভিন্ন ধরণের ডেটা বিশ্লেষণ, প্লটলি এক্সপ্রেস (ভিজ্যুয়ালাইজেশন), কাজের অটোমেশন এবং ওয়েব স্ক্র্যাপিং শিখুন।
১. VS Code ডাউনলোড করা
VS Code/Cursor/Anti Gravity ইত্যাদি যেকোনো কোড এডিটর যা আপনি পছন্দ করেন তা ডাউনলোড করুন। আমি VS Code পছন্দ করি, তাই আমি তাদের ইনস্টলেশন লিঙ্ক সংযুক্ত করছি।
দ্রষ্টব্য: উইন্ডোজ ব্যবহারকারীদের জন্য, এমএস উইন্ডোজ স্টোর থেকে VS Code বা পাইথন ইনস্টল করলে ভবিষ্যতে অনেক সমস্যা তৈরি হয়, তাই আমি আপনাকে তা এড়ানোর পরামর্শ দেব।
২. পাইথন ইনস্টল করা
তাদের অফিসিয়াল সোর্স লিঙ্ক থেকে পাইথন ইনস্টল করুন।
৩. ভার্চুয়াল এনভায়রনমেন্ট (Virtual Environments)
এই ভিডিওটি দেখা এবং কীভাবে একটি পাইথন ভার্চুয়াল এনভায়রনমেন্ট সেট আপ করতে হয় তা শেখা।
এই ভিডিওটি একটু কঠিন মনে হতে পারে, তবে যেকোনো পাইথন কোর্স বা অন্যান্য ভিডিও শুরু করার আগে ভার্চুয়াল এনভায়রনমেন্ট শুরু করতে শেখাটা গুরুত্বপূর্ণ (আমার মনে হয়)। ভিডিও লিঙ্ক:
৪. পাইথন বেসিকস (Python Basics)
Bro Code থেকে আপডেটেড পাইথন বেসিকস টিউটোরিয়ালটি দেখা। ৯ ঘণ্টা ২০ মিনিট পর্যন্ত। তিনি যে সমস্ত গেম এবং অনুশীলন দেন তা তার দেওয়া সমাধান দেখার আগে নিজে থেকে আলাদাভাবে অনুশীলন করা উচিত। ইউডেমি (Udemy), কোর্সেরা (Coursera) এবং ইউটিউব (YouTube) খোঁজার পর এটিই আমি সবচেয়ে পরিষ্কার পাইথন টিউটোরিয়াল পেয়েছি।
এই ভিডিও থেকে, আপনার নিচের পাইথন ক্যানভাসে বর্ণিত মৌলিক ধারণাগুলো শিখতে হবে। এই ক্যানভাসের রূপরেখা অনুসরণ করা আপনাকে কীভাবে সবকিছু একসাথে সংযুক্ত হয় সে সম্পর্কে একটি পরিষ্কার ভিজ্যুয়াল ধারণাও দেবে।
৫. নাম্পাই এবং পান্ডাস (NumPy and Pandas)
এরপর, আমরা আর্থিক এবং ব্যবসায়িক বিশ্লেষক হিসেবে পাইথন ব্যবহারের খুঁটিনাটি এবং প্যাকেজগুলোতে প্রবেশ করব। আমরা আইবিএম (IBM)-এর এই কোর্সটি অনুসরণ করব। আমরা চাইলে এখানে সার্টিফিকেশনও অর্জন করতে পারি, তবে তা ঐচ্ছিক এবং প্রয়োজনীয় নয়।
এই কোর্স থেকে শুধুমাত্র মডিউল ৪ এবং মডিউল ৫ শিখুন, আগের মডিউলগুলো উল্লিখিত ভিডিওগুলোতে আরও ভালোভাবে ব্যাখ্যা করা হয়েছে।
https://cognitiveclass.ai/courses/python-for-data-science
শেখার লক্ষ্য: নাম্পাই (NumPy) এবং পান্ডাস (Pandas)
যদি আপনি মনে করেন যে এই ২টি মডিউল পান্ডাস শেখার জন্য যথেষ্ট ছিল না এবং শুধুমাত্র যদি আপনি তা মনে করেন, তবে, অ্যালেক্স দ্য অ্যানালিস্ট (Alex the Analyst)-এর এই প্লেলিস্টটি যথেষ্ট হবে:
https://www.youtube.com/watch?v=dUpyC40cF6Q&list=PLUaB-1hjhk8GZOuylZqLz-Qt9RIdZZMBE
৬. তাত্ত্বিক কঠোরতা এবং দক্ষতা পরীক্ষা
এরপর, একটু বেশি থিওরি ভিত্তিক শেখা, যা সম্পর্কে আমাদের ইতিমধ্যেই কিছু ধারণা আছে, তাই এটি খুব কঠিন হবে না। মূলত, আমরা পাইথনের মাধ্যমে ডেটা অ্যানালিটিক্সের জন্য ব্যবহার করি এমন কিছু মূল উপাদান শিখব।
https://cognitiveclass.ai/courses/data-analysis-python
সব মডিউল প্রয়োজনীয়। সার্টিফিকেশনও সম্ভব।
আমরা যে ৬টি উপাদান শিখেছি সে পর্যন্ত আপনার দক্ষতা পরীক্ষা করার জন্য, ফ্রি-কোড-ক্যাম্প (FreeCodeCamp)-এ ডেটা অ্যানালিটিক্সে সার্টিফিকেশন পাওয়ার জন্য প্রয়োজনীয় বিনামূল্যের কাজগুলো (tasks) করুন।
https://www.freecodecamp.org/learn/data-analysis-with-python/
এটি একটি প্রয়োজনীয় পদক্ষেপ। উপেক্ষা করা উচিত নয়।
৭. প্লটলি দিয়ে ভিজ্যুয়ালাইজেশন (Visualization With Plotly)
অভিনন্দন, আপনি পাইথন ব্যবহার করে ডেটা অ্যানালিটিক্স করার একদম প্রাথমিক বিষয়গুলো শিখে ফেলেছেন। কিন্তু এখন আপনি আপনার অ্যানালিটিক্স দক্ষতা প্রদর্শন করতে চান, কারণ হাজার শব্দের চেয়ে একটি ছবি ভালো। সুতরাং, আমরা তা শিখব, আমরা প্লটলি এক্সপ্রেস (Plotly Express) শিখব। এছাড়াও, আপনি যদি সব পরিস্থিতিতে সম্পূর্ণ প্রস্তুত থাকতে চান তবে ম্যাটপ্লটলিব (Matplotlib) এবং সির্ন (Seaborn)-ও শিখতে পারেন।
কিন্তু, আপনি এখনও শেখার জন্য প্রয়োজনীয় মূল দিকগুলোর মধ্যে একটি তৈরি করেননি। তা হলো, ডকুমেন্টেশন পড়া এবং কোনো টিউটোরিয়াল আপনাকে স্পষ্টভাবে পরিচালনা করা ছাড়াই আপনি যে পরিস্থিতির মুখোমুখি হচ্ছেন এবং যে লাইব্রেরি নিয়ে কাজ করছেন তার উপর ভিত্তি করে সমস্যার সমাধান করা।
সুতরাং, এই দুটি লক্ষ্য মাথায় রেখে, আমরা প্লটলি এক্সপ্রেসের ডকুমেন্টেশন ব্যবহার করব, যা অত্যন্ত স্পষ্টভাবে নথিভুক্ত এবং সুন্দরভাবে লেখা।
ম্যাটপ্লটলিবের বিপরীতে প্লটলি এক্সপ্রেস ব্যবহার করে একটি ভালো ভিজ্যুয়াল পাওয়া বেশ সহজ। তাই, আমরা তা দিয়ে শুরু করব:
https://plotly.com/python/plotly-express/
এই লিঙ্কে যান। এই লিঙ্কে, কিছু মৌলিক ভিজ্যুয়ালাইজেশন কৌশল এইভাবে তালিকাভুক্ত করা হয়েছে:
-Basics: scatter, line, area, bar, funnel, timeline
-Part-of-Whole: pie, sunburst, treemap, icicle, funnel_area
-1D Distributions: histogram, box, violin, strip, ecdf
…চলবে
প্রতিটি লিঙ্কে ক্লিক করুন এবং আপনার নিজের গতিতে সেগুলোর প্রতিটি কীভাবে তৈরি করবেন তা শিখুন এবং প্লটলি আপনাকে যে ডিফল্ট ডেটাসেট উদাহরণ দেয় তার পাশাপাশি আপনার কাছে ইতিমধ্যে থাকা যেকোনো ডেটাসেট তৈরি/ব্যবহার করে নিজেকে চ্যালেঞ্জ করুন।
যদি আপনি প্লটলি (প্লটলি এক্সপ্রেসের বস) সম্পর্কে আরও শিখতে চান, তবে এটি আপনাকে সাহায্য করবে:
https://www.youtube.com/watch?v=GGL6U0k8WYA&t=241s
এখন, যদিও প্লটলি (এবং এর সংক্ষিপ্ত সংস্করণ প্লটলি এক্সপ্রেস এবং উপরেরটি) পাইথনে ডেটা ভিজ্যুয়ালাইজেশনের জন্য প্রায় সম্পূর্ণ প্যাকেজ, তবুও বেশিরভাগ কোর্স এবং অন্যান্য ব্যবহারকারীরা দুটি খুব ভিন্ন লাইব্রেরির সাথে বেশি পরিচিত। ম্যাটপ্লটলিব (Matplotlib) এবং সির্ন (Seaborn) (যা ম্যাটপ্লটলিবকে ভিত্তি হিসেবে ব্যবহার করে)।
সুতরাং, আপনি হয়তো এটি শিখে রাখতে চাইবেন। এটি আরও জটিল হতে চলেছে কারণ ম্যাটপ্লটলিব ‘আনপাইথনিক’ (unpythonic) এবং আসলে ম্যাট ল্যাব (MATLAB)-এর ভাষার কাঠামোর বেশি কাছাকাছি। কিন্তু, আর কি করা। কি আর করা যাবে।
https://cognitiveclass.ai/courses/data-visualization-python
উপরের কোর্সের সমস্ত মডিউল অনুসরণ করুন এবং সির্ন (Seaborn)-এর পরিষ্কার ধারণার জন্য, নিচের কোর্সটি অনুসরণ করুন:
https://www.youtube.com/watch?v=6GUZXDef2U0
এটি যথেষ্ট হওয়া উচিত।
৮. ওয়েব স্ক্র্যাপিং এবং অটোমেশন
আমরা প্রায় শেষ করে ফেলেছি! আমাদের শুধু কিছু শূন্যস্থান পূরণ করতে হবে যা আমাদের থাকতেও পারে আবার নাও থাকতে পারে। সুতরাং, আমাদের কিছু স্ক্র্যাপিং করার প্রয়োজন হতে পারে (এখন পর্যন্ত, আমাদের “requests” লাইব্রেরির সাথে পরিচিত হওয়া উচিত) এবং এ ব্যাপারে কিছু ডেডিকেটেড সাহায্যের প্রয়োজন হতে পারে। তাই, আমরা বিউটিফুলস্যুপ (beautifulsoup) এবং রিকোয়েস্টস (requests) সম্পর্কে আরও বিস্তারিত জানব। এর জন্য, এই ভিডিওটি:
https://www.youtube.com/watch?v=XVv6mJpFOb0
যদি আমাদের পাইথন সম্পর্কিত জিনিসের জন্য মেশিন লার্নিং এবং সম্পর্কিত জ্ঞানের প্রয়োজন হয়, তবে নিচের কোর্সটি শুরুর পয়েন্ট হিসেবে কাজ করতে পারে:
https://cognitiveclass.ai/courses/machine-learning-with-python
যদি আপনি খুব ফিনান্সিয়াল এবং অন্যান্য বিশ্লেষণ ভিত্তিক ব্যক্তি হতে চান, তবে মনটে কার্লো সিমুলেশন (Monte Carlo Simulation), পাইথন ব্যবহার করে অপ্টিমাল পোর্টফোলিও তৈরি করার বিষয়ে ম্যাথিউ উইলিয়াম রোসেনার, সিএফএ (Matthew William Roesener, CFA)-এর কিছু প্লেলিস্ট সহায়ক হতে পারে, কিন্তু এখন পর্যন্ত, এই কাজগুলো নিজে করার জন্য আপনার যথেষ্ট পাইথন জ্ঞান থাকা উচিত।
https://www.youtube.com/@matthewroesener/playlists
যদি আপনি প্রতিদিনের কাজগুলো অটোমেট করতে চান এবং কীভাবে তা করতে হয় সে সম্পর্কে ধারণা পেতে চান, তবে আপনি নিচের ২টি ভিডিও দেখতে পারেন
https://www.youtube.com/watch?v=PXMJ6FS7llk
https://www.youtube.com/watch?v=s8XjEuplx_U
এছাড়াও, যে প্রক্রিয়াটি আপনাকে নিয়মিত করতে হয় এবং অনেক সময় নেয়, আপনি চেষ্টা করলে সম্ভবত তা নিজেই অটোমেট করতে পারবেন।
এগুলোই কিছু বিশেষ ক্ষেত্র যা কেউ তাদের কর্মক্ষেত্রে মুখোমুখি হতে পারে বলে আমি মনে করতে পারি। আপনি এখন আপনার নিজের অনুসন্ধান চালাতে পারেন এবং আপনার শেখার যাত্রাকে নিজের মতো করে কাজে লাগাতে পারেন।
প্রজেক্ট তৈরি করতে থাকুন, ব্যবহার করুন
অভিনন্দন! আপনি এখন আপনার ডেটা বিশ্লেষণ যাত্রার জন্য প্রতিদিনের ড্রাইভার হিসেবে পাইথন ব্যবহার করার জন্য প্রয়োজনীয় প্রায় সমস্ত দিক পূরণ করেছেন।
এখন, আসুন কিছু “রিচিং গোল” (reaching goals) বা অতিরিক্ত লক্ষ্য নিয়ে কথা বলি, যে লক্ষ্যগুলো সম্ভবত আপনার পাইথন বা অন্যান্য জিনিসের জন্য প্রয়োজন হবে না, তবে থাকলে ভালো।
৯. অন্যান্য ভালো দক্ষতা (Other Nice to Have Skills)
(i) এসকিউএল শেখা (Learning SQL)। এসকিউএল অবিশ্বাস্যভাবে সহায়ক, অবিশ্বাস্যভাবে। তাই, এটি আপনার সময়ের উপযুক্ত হতে পারে।
https://youtu.be/ztHopE5Wnpc?si=GTS2T8VSjF6r3y1v
উপরের ভিডিওটি আপনাকে এসকিউএল সম্পর্কে একটি ধারণাগত কাঠামো দেবে।
এবং নিচের ভিডিওটি আপনাকে এমএস এসকিউএল সার্ভারে (MS Sql Server) কাজ করার একটি পাঠ দেবে:
https://www.youtube.com/watch?v=LGTbdjoEBVM
ডেটাবেস স্টারের (Database Star) ডেটাবেস ডিজাইন সম্পর্কিত নিচের প্লেলিস্টটি আপনাকে বিভিন্ন ধরণের ডেটাবেস কীভাবে তৈরি/গঠন/কাজ করতে হয় সে সম্পর্কে ধারণা দেবে:
https://www.youtube.com/watch?v=-C2olg3SfvU&list=PLZDOU071E4v6epq3GS0IqZicZc3xwwBN_
এছাড়াও, ডকারে তার ডেটাবেস সেটআপ সম্পর্কিত প্লেলিস্টটি আমার জন্য অবিশ্বাস্যভাবে সহায়ক ছিল। নিচে দেওয়া হলো:
https://www.youtube.com/watch?v=OTglm9fVCL4&list=PLZDOU071E4v7UbgZMsnn5SZvk1GIAuLcX
(ii) আপনার ক্যারিয়ারের জন্য পাওয়ার বিআই (PowerBI)/ট্যাবলো (Tableau) এবং এর কিছু শেখাও অবিশ্বাস্যভাবে মূল্যবান হতে পারে।
এর জন্য, বিশেষ করে কিছু মাইক্রোসফ্ট পাওয়ার টুলস সম্পর্কিত এই প্লেলিস্টটি আপনার জন্য সহায়ক হতে পারে:
https://www.youtube.com/watch?v=ja68xMpabQA&list=PLrRPvpgDmw0lAIQ6DPvSe_hfAraNhTvS4
যেহেতু আপনি ইতিমধ্যে একটি প্রোগ্রামিং ভাষা শিখেছেন, তাই ডকুমেন্টেশন এবং অন্যান্য জিনিস পড়ে নিজে নিজে পাওয়ার বিআই নেভিগেট করা আপনার জন্য খুব কঠিন হবে না।
আমি আসলে ট্যাবলো ব্যবহার করিনি তবে আমি ধরে নিচ্ছি এটি পাওয়ার বিআই থেকে খুব বেশি আলাদা হবে না।