ڈیٹا اور مالیاتی تجزیات کے لیے میرا ازخود پائتھون سیکھنے کا سفر (Learning Path/Module)
یہ ایک “مرحلہ وار ازخود پائتھون ٹیوٹوریل” ہے۔ خاص طور پر مالیاتی/ڈیٹا تجزیہ کار/اکاؤنٹنگ کے پیشے اور زیادہ بصری سیکھنے والوں (visual learners) کے لیے بنایا گیا ہے۔ اس نے مجھے مؤثر طریقے سے پائتھون سیکھنے میں مدد کی ہے، امید ہے کہ یہ آپ کی بھی مدد کرے گا۔
مرحلہ وار ہدایات
پائتھون اور پروگرامنگ کی بنیادی باتیں، Numpy، Pandas (ڈیٹا ہیرا پھیری)، ڈیٹا تجزیہ کی مختلف شکلیں، Plotly Express (بصری کاری)، کام کی آٹومیشن اور ویب سکریپنگ سیکھیں۔
1. VS Code ڈاؤن لوڈ کرنا
کوئی بھی کوڈ ایڈیٹر جو آپ پسند کرتے ہیں ڈاؤن لوڈ کریں جیسے VS Code/Cursor/Anti Gravity وغیرہ۔ میں VS Code کو ترجیح دیتا ہوں، اس لیے، میں ان کا انسٹالیشن لنک منسلک کر رہا ہوں۔
نوٹ: ونڈوز استعمال کرنے والوں کے لیے، MS Windows Store سے VS Code یا Python انسٹال کرنا مستقبل میں بہت سے مسائل پیدا کرتا ہے، اس لیے میں آپ کو مشورہ دوں گا کہ اس سے گریز کریں۔
2. Python انسٹال کرنا
ان کے آفیشل سورس لنک سے Python انسٹال کریں۔
3. ورچوئل انوائرمنٹ (Virtual Environments)
اس ویڈیو کو دیکھنا اور Python Virtual Environment سیٹ اپ کرنے کا طریقہ سیکھنا۔
یہ ویڈیو شاید تھوڑا مشکل لگے، لیکن کوئی بھی Python Course یا دیگر ویڈیوز شروع کرنے سے پہلے ورچوئل انوائرمنٹ شروع کرنا سیکھنا ضروری ہے (مجھے لگتا ہے)۔ ویڈیو لنک:
4. Python Basics
Bro Code سے اپ ڈیٹ شدہ Python Basics ٹیوٹوریل دیکھنا۔ 9 گھنٹے 20 منٹ کے نشان تک۔ وہ جو بھی گیمز اور مشقیں دیتا ہے ان کی مشق اس کی طرف سے فراہم کردہ حل کو دیکھنے سے پہلے انفرادی طور پر خود کی جانی چاہیے۔ Udemy، Coursera اور YouTube پر تلاش کرنے کے بعد یہ سب سے صاف ستھرا python ٹیوٹوریل ہے جو مجھے مل سکا۔
اس ویڈیو سے، آپ کو نیچے دیے گئے Python Canvas میں بیان کردہ بنیادی تصورات سیکھنے چاہئیں۔ اس کینوس میں خاکہ کی پیروی کرنے سے آپ کو یہ واضح بصری سمجھ بھی ملے گی کہ سب کچھ ایک ساتھ کیسے جڑا ہوا ہے۔
5. NumPy اور Pandas
اس کے بعد، ہم ایک مالیاتی اور کاروباری تجزیہ کار کے طور پر Python کا استعمال کرنے کے حوالے سے چھوٹی موٹی تفصیلات اور پیکجز میں داخل ہوں گے۔ ہم IBM کے اس کورس کی پیروی کریں گے۔ اگر ہم چاہیں تو یہاں سرٹیفیکیشن بھی حاصل کر سکتے ہیں، لیکن یہ اختیاری ہے اور ضروری نہیں ہے۔
اس کورس سے صرف ماڈیول 4 اور ماڈیول 5 سیکھیں، پچھلے ماڈیولز کی وضاحت مذکورہ ویڈیوز میں بہتر طریقے سے کی گئی ہے۔
https://cognitiveclass.ai/courses/python-for-data-science
سیکھنے کا مقصد: NumPy اور Pandas
اگر آپ کو لگتا ہے کہ یہ 2 ماڈیولز Pandas سیکھنے کے لیے کافی نہیں تھے اور صرف اگر آپ ایسا محسوس کرتے ہیں، تو، Alex the Analyst کی یہ پلے لسٹ کافی ہونی چاہیے:
https://www.youtube.com/watch?v=dUpyC40cF6Q&list=PLUaB-1hjhk8GZOuylZqLz-Qt9RIdZZMBE
6. نظریاتی سختی اور مہارت کا امتحان (Theoritical Rigour and Skill Test)
اس کے بعد، ایک اور تھیوری پر مبنی سیکھنا، جس کے بارے میں ہمارے پاس پہلے سے ہی کچھ خیالات ہیں، لہذا، یہ زیادہ مشکل نہیں ہوگا۔ بنیادی طور پر، ہم کچھ بنیادی عناصر سیکھیں گے جو ہم python کے ذریعے ڈیٹا اینالیٹکس کے لیے استعمال کرتے ہیں۔
https://cognitiveclass.ai/courses/data-analysis-python
تمام ماڈیولز ضروری ہیں۔ سرٹیفیکیشن بھی ممکن ہے۔
ہم نے جو 6 اجزاء سیکھے ہیں ان تک اپنی صلاحیتوں کو جانچنے کے لیے، FreeCodeCamp میں ڈیٹا اینالیٹکس میں سرٹیفیکیشن حاصل کرنے کے لیے جمع کرانے کے لیے درکار مفت کام (tasks) لیں۔
https://www.freecodecamp.org/learn/data-analysis-with-python/
یہ ایک ضروری قدم ہے۔ نظر انداز نہیں کیا جانا چاہئے۔
7. Plotly کے ساتھ بصری کاری (Visualization With Plotly)
مبارک ہو، آپ نے python کا استعمال کرتے ہوئے ڈیٹا اینالیٹکس کرنے کی بہت بنیادی باتیں سیکھ لی ہیں۔ لیکن اب آپ اپنی تجزیاتی مہارت کا مظاہرہ کرنا چاہتے ہیں، کیونکہ ایک تصویر ہزار الفاظ سے بہتر ہے۔ لہذا، ہم وہ سیکھیں گے، ہم Plotly Express سیکھیں گے۔ اس کے علاوہ، اگر آپ تمام حالات میں مکمل ثبوت بننا چاہتے ہیں تو Matplotlib اور Seaborn بھی سیکھ سکتے ہیں۔
لیکن، آپ نے ابھی تک سیکھنے کے لیے ضروری اہم پہلوؤں میں سے ایک تیار نہیں کیا ہے۔ وہ یہ ہے کہ، دستاویزات کو پڑھنا اور ان حالات کی بنیاد پر مسائل کو حل کرنا جو آپ کو دیے گئے ہیں اور وہ لائبریری جس کے ساتھ آپ کو بغیر کسی ٹیوٹوریل کے واضح طور پر آپ کو چلانے کے کام کرنا ہے۔
لہذا، ان دو اہداف کو ذہن میں رکھتے ہوئے، ہم Plotly Express کی دستاویزات کا استعمال کریں گے، جو انتہائی واضح طور پر دستاویزی اور اچھی طرح سے لکھی گئی ہے۔
Matplotlib کے برعکس Plotly Express کا استعمال کرتے ہوئے ایک اچھا ویژول حاصل کرنا بہت آسان ہے۔ لہذا، اس کے ساتھ شروع کریں گے:
https://plotly.com/python/plotly-express/
اس لنک پر جائیں۔ اس لنک میں، کچھ بنیادی بصری تکنیکیں اس طرح درج ہیں:
-Basics: scatter, line, area, bar, funnel, timeline
-Part-of-Whole: pie, sunburst, treemap, icicle, funnel_area
-1D Distributions: histogram, box, violin, strip, ecdf
…جاری ہے
ہر ایک لنک پر کلک کریں اور سیکھیں کہ ان میں سے ہر ایک کو اپنی رفتار سے کیسے بنایا جائے اور ڈیفالٹ ڈیٹاسیٹ کی مثال کے ساتھ جو Plotly پہلے سے آپ کو دیتا ہے، جو بھی ڈیٹاسیٹ آپ کے پاس پہلے سے ہیں اسے بنا کر/استعمال کر کے خود کو چیلنج کریں۔
اگر آپ Plotly (Plotly Express کے باس) کے بارے میں مزید جاننا چاہتے ہیں، تو یہ آپ کی مدد کرے گا:
https://www.youtube.com/watch?v=GGL6U0k8WYA&t=241s
اب، جب کہ Plotly (اور اس کا کٹا ہوا ورژن Plotly Express اور اوپر والا) Python میں ڈیٹا ویژولائزیشن کے لیے تقریباً سب سے مکمل پیکج ہے، زیادہ تر کورسز اور دیگر صارفین دو بہت مختلف لائبریریوں سے زیادہ واقف ہیں۔ Matplotlib اور Seaborn (جو Matplotlib کو بنیاد کے طور پر استعمال کرتا ہے)۔
لہذا، آپ شاید اسے صرف اس لیے سیکھنا چاہیں گے۔ یہ زیادہ پیچیدہ ہونے والا ہے کیونکہ Matplotlib ‘unpythonic’ ہے اور درحقیقت MATLAB کے زبان کے ڈھانچے کے زیادہ قریب ہے۔ لیکن، اوہ اچھا۔ آپ کیا کر سکتے ہیں۔
https://cognitiveclass.ai/courses/data-visualization-python
مندرجہ بالا کورس کے تمام ماڈیولز کی پیروی کریں اور Seaborn کے صاف نظارے کے لیے، نیچے دیے گئے کورس کی پیروی کریں:
https://www.youtube.com/watch?v=6GUZXDef2U0
یہ کافی ہونا چاہئے۔
8. ویب سکریپنگ اور آٹومیشن
ہم تقریباً وہاں پہنچ چکے ہیں! ہمیں صرف کچھ خلا کو پُر کرنے کی ضرورت ہے جو ہمارے پاس ہو سکتا ہے یا نہیں بھی۔ لہذا، ہمیں کچھ سکریپنگ کرنے کی ضرورت پڑ سکتی ہے (اب تک، ہمیں “requests” لائبریری سے واقف ہونا چاہیے) اور اس کے لیے کچھ وقف شدہ مدد کی ضرورت پڑ سکتی ہے۔ لہذا، ہم beautifulsoup اور requests کو تھوڑی اور تفصیلات میں سیکھیں گے۔ اس کے لیے یہ ویڈیو:
https://www.youtube.com/watch?v=XVv6mJpFOb0
اگر ہمیں python سے متعلق چیزوں کے لیے مشین لرننگ اور متعلقہ علم کی ضرورت ہو تو، نیچے دیا گیا کورس نقطہ آغاز کے طور پر کام کر سکتا ہے:
https://cognitiveclass.ai/courses/machine-learning-with-python
اگر آپ بہت مالیاتی اور دیگر تجزیہ پر مبنی فرد بننے جا رہے ہیں تو، مونٹی کارلو سمولیشن (Monte Carlo Simulation)، python کا استعمال کرتے ہوئے بہترین پورٹ فولیو بنانے پر Matthew William Roesener, CFA کی کچھ پلے لسٹس مددگار ثابت ہو سکتی ہیں، لیکن اب تک، آپ کو یہ کام خود کرنے کے قابل ہونے کے لیے پہلے سے ہی Python کی کافی سمجھ ہونی چاہیے۔
https://www.youtube.com/@matthewroesener/playlists
اگر آپ روزمرہ کے کاموں کو خودکار بنانا چاہتے ہیں، اور اس کے بارے میں خیالات حاصل کرنا چاہتے ہیں کہ اسے کیسے کریں، تو آپ نیچے دی گئی 2 ویڈیوز دیکھ سکتے ہیں
https://www.youtube.com/watch?v=PXMJ6FS7llk
https://www.youtube.com/watch?v=s8XjEuplx_U
اس کے علاوہ، جو بھی عمل آپ کو باقاعدگی سے کرنا پڑتا ہے اور بہت زیادہ وقت صرف کرتا ہے، اس بات کا اچھا امکان ہے کہ اگر آپ کوشش کریں تو آپ اسے خود بخود کر سکتے ہیں۔
یہ کچھ کنارے کے معاملات ہیں جو کوئی بھی اپنے کام کی جگہوں پر آ سکتا ہے جس کے بارے میں میں سوچ سکتا ہوں۔ اب آپ اپنی تلاش خود کر سکتے ہیں اور اپنے سیکھنے کے سفر کو خود استعمال کر سکتے ہیں۔
پروجیکٹس بناتے رہیں، اسے استعمال کریں
مبارک ہو! آپ نے اب تقریباً تمام زاویوں کو پُر کر لیا ہے جن کی آپ کو اپنے ڈیٹا تجزیہ کے سفر کے لیے روزانہ ڈرائیور کے طور پر python استعمال کرنے کی ضرورت پڑ سکتی ہے۔
اب، آئیے کچھ “پہنچنے والے اہداف” (reaching goals) کے بارے میں بات کرتے ہیں، جیسے ایسے اہداف جن کی آپ کو Python یا دیگر چیزوں کے لیے شاید ضرورت نہیں ہوگی، لیکن اس کا ہونا اچھا ہو سکتا ہے۔
9. دیگر اچھی مہارتیں (Other Nice to Have Skills)
(i) SQL سیکھنا۔ SQL ناقابل یقین حد تک مددگار ہے، ناقابل یقین حد تک۔ لہذا، یہ آپ کے وقت کے قابل ہو سکتا ہے۔
https://youtu.be/ztHopE5Wnpc?si=GTS2T8VSjF6r3y1v
مندرجہ بالا ویڈیو آپ کو SQL کے بارے میں ایک تصوراتی فریم ورک دے گی۔
اور نیچے دی گئی ویڈیو آپ کو MS Sql Server پر کام کرنے کا سبق دے گی:
https://www.youtube.com/watch?v=LGTbdjoEBVM
Database Star کی ڈیٹا بیس ڈیزائن سے متعلق نیچے دی گئی پلے لسٹ آپ کو مختلف قسم کے ڈیٹا بیس کو بنانے/تخلیق/کام کرنے کے طریقے کے بارے میں ایک خیال دے گی:
https://www.youtube.com/watch?v=-C2olg3SfvU&list=PLZDOU071E4v6epq3GS0IqZicZc3xwwBN_
اس کے علاوہ، ڈوکر میں اس کی ڈیٹا بیس سیٹ اپ سے متعلق پلے لسٹ میرے لیے ناقابل یقین حد تک مددگار تھی۔ ذیل میں دی گئی ہے:
https://www.youtube.com/watch?v=OTglm9fVCL4&list=PLZDOU071E4v7UbgZMsnn5SZvk1GIAuLcX
(ii) PowerBI/Tableau اور اس میں سے کچھ سیکھنا بھی آپ کے کیریئر کے لیے ناقابل یقین حد تک قیمتی ثابت ہو سکتا ہے۔
اس کے لیے، خاص طور پر مائیکروسافٹ پاور ٹولز کے بارے میں یہ پلے لسٹ آپ کے لیے مددگار ثابت ہو سکتی ہے:
https://www.youtube.com/watch?v=ja68xMpabQA&list=PLrRPvpgDmw0lAIQ6DPvSe_hfAraNhTvS4
اس بات کو دیکھتے ہوئے کہ آپ نے پہلے ہی پروگرامنگ زبان سیکھ لی ہے، اس لیے دستاویزات اور دیگر چیزیں پڑھ کر خود Power BI کے ذریعے نیویگیٹ کرنا آپ کے لیے زیادہ مشکل نہیں ہوگا۔
میں نے اصل میں Tableau استعمال نہیں کیا ہے لیکن میرا خیال ہے کہ یہ Power BI سے زیادہ مختلف نہیں ہوگا۔