מאיילון ל-Production: איך אני מנהל את הבלוג הזה מהפלאפון (בלי לפתוח לפטופ)
גילוי נאות
הפוסט שאתם קוראים עכשיו? הוא לא נכתב מול מקלדת. הוא התחיל כשיחה קולית עם Gemini תוך כדי נסיעה, עבר ל-Custom GPT לביצוע, משם ל-GitHub Copilot לליטוש, ולבסוף לפרודקשן ב-Vercel. בלי לפתוח לפטופ אפילו פעם אחת.
הבעיה: Context Switching
גיליתי שקל לי לדבר על רעיונות, אבל כשצריך להפוך אותם למילים כתובות אני נתקע.
המציאות היא שאני מבלה לא מעט זמן בנסיעות, והשימוש ב-Voice Mode של מודלי AI הפך אצלי לטבע שני בזמן נהיגה. אני מדבר איתם, מתייעץ, חושב בקול רם.
הבעיה שזיהיתי? היא לא הכתיבה עצמה, אלא ה-Context Switching. המעבר מ"רעיון" ל"עריכת טקסט" הוא המקום שבו הרעיון מתפספס.
אז החלטתי לבנות מנגנון שעוקף את החיכוך הטכני הזה ומאפשר לי להפוך שיחה טבעית לפוסט בבלוג, בלי לשבור את רצף המחשבה.
בניתי autonomous workflow עם human-in-the-loop: שרשרת של כלים שעובדים אחד עם השני, כשאני מתפקד כמפקח שנותן את הטאץ' האישי ומאשר את התוצאה הסופית.
הסטאק: איך הכל מתחבר?
המטרה הייתה לבנות שיטת עבודה שלא דורשת ממני לכתוב קוד והגעתי למשהו כזה:
- Gemini (Voice): המוח והיצירתיות.
- Custom GPT: העורך הלשוני והאינטגרציה (ל-GitHub).
- GitHub Copilot: המתכנת.
- Vercel: סביבת ה-Preview והפרודקשן.
למה הסטאק הזה כל כך מורכב? (או: למה אני צריך שני צ'אטים?)
האידיאל? אפליקציה אחת. אבל כרגע, לכל כלי יש חתיכה חסרה בפאזל, מה שאילץ אותי ליצור Flow היברידי:
למה לא רק Gemini? בזמן ש-Gemini הוא מודל מדויק יותר לשיחה, ל-Gems אין עדיין יכולת להריץ Actions חיצוניים. הוא חושב מדהים, אבל לא יכול לפתוח Issue.
ולמה לא רק ChatGPT? ל-Custom GPT יש Actions, אבל:
- אין מודלי חשיבה (Thinking Models): בתוך ה-GPT המותאם אי אפשר להשתמש במודלים שיודעים "לחשוב" לעומק ולבנות ארגומנטים מורכבים.
- Voice Control לא מפעיל Actions: בנהיגה, אני לא יכול להפעיל API Actions בקול. המערכת דורשת אישור טקסטואלי.
לכן, החלוקה היא: Gemini חושב, GPT מבצע.
קונטקסט: GitHub Issues & Custom GPT
כל הניהול מתבצע על גבי GitHub Issues, זה ה-Source of Truth של הבלוג. כדי לייצר את ה-Issues האלה בקלות, הגדרתי Custom GPT עם שלוש פעולות פשוטות: create, get, update.
חשוב להגיד: ה-Custom GPT הוא לא חובה. הייתי יכול טכנית לפתוח Issue ידנית באפליקציה של GitHub. אבל יש משהו מאוד נוח בלהישאר בממשק של צ'אט. היכולת לעשות איטרציות ("תשנה את הפסקה השנייה", "תעדכן את הכותרת") מול בוט שעושה את העבודה השחורה בשבילי, משאירה אותי בזרימה של שיחה במקום בניהול טפסים.
רוצים לבנות GPT כזה בעצמכם? המדריך: danielsinai/github-issues-customgpt
ה-Workflow: מאיילון לפרודקשן
התהליך מתחלק ל-5 שלבים עיקריים:
שלב 1: שיחה ויצירת תוכן (Gemini Voice)
אני נוהג, מדבר עם Gemini בקול, והוא עוזר לי לזקק את הרעיון. התוכן הגולמי נוצר באופן טבעי תוך כדי השיחה.
↓ העברת תוכן
שלב 2: עיבוד וניהול (Custom GPT)
אני מעביר את התוכן ל-Custom GPT ומנהל איתו שיחה. הוא עורך ומשפר את הטקסט בזמן אמת, מעדכן את ה-Issue בהתאם להערות ולשינויים, עד שאנחנו מגיעים לגרסה סופית.
↓ יצירת Issue
שלב 3: ליטוש ועריכה (GitHub Copilot)
אני פשוט עושה Assign ל-Copilot בתוך ה-Issue. הוא מזהה את המשימה, ממיר את התוכן לקובץ MDX, מסדר תגיות, ופותח Pull Request.
↓ פתיחת PR
שלב 4: בדיקת Preview (Vercel)
אני מקבל לינק ל-Preview Environment, רואה איך הפוסט נראה באמת במובייל, ומאשר שהכל תקין.
↓ Merge
שלב 5: פרסום (Production)
לחיצה על Squash and Merge באפליקציה של GitHub, והפוסט באוויר באתר הבלוג.
העתיד כבר כאן
אני מודה, כרגע ה-Workflow הזה מעט מסורבל. להעביר טקסט בין אפליקציות זה לא האידיאל. אבל אין לי ספק שלשם העולם הולך. הפיצ'רים האלה, היכולת של AI לבצע פעולות, החיבור ל-Voice והאוטונומיה תחת פיקוח אנושי, יהפכו בקרוב לסטנדרט ביום-יום שלנו.
וזה לא רק תחושה. Cursor כבר מדברים על פתרונות Mobile שיאפשרו לפתח קוד ישירות מהאייפון. זה מחזק את הטענה שזה באמת הכיוון שבו התעשייה הולכת.
המגבלות שתיארתי כאן ייעלמו, והתהליך הזה יהיה שקוף לחלוטין. עד אז? אני אמשיך לנסות לדחוף את הכלים האלה לקצה, גם מהרמזור.
נ.ב. אם ניסיתם להרים משהו דומה, מה דעתכם? האם העולם הולך לשם? האם נראה בקרוב אנשים מעלים קוד מהרכב? או שזה עוד רחוק משם? שלחו לי הודעה, מעניין אותי לשמוע.