ಬಳಕೆದಾರರೊಂದಿಗೆ ಸಂವಹನ ನಡೆಸುವ, ಸಂಭಾಷಣೆಗಳನ್ನು ಲಿಪ್ಯಂತರ ಮತ್ತು ಭಾಷಾಂತರಿಸುವ ಅಪ್ಲಿಕೇಶನ್ಗಳನ್ನು ನಿರ್ಮಿಸಲು ಡೆವಲಪರ್ಗಳಿಗೆ ಸಹಾಯ ಮಾಡಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾದ ಹಲವಾರು ಹೊಸ ಧ್ವನಿ ಗುಪ್ತಚರ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಅದರ API ಈಗ ಒಳಗೊಂಡಿದೆ ಎಂದು OpenAI ಗುರುವಾರ ಹೇಳಿದೆ.
ಕಂಪನಿಯ ಹೊಸ GPT‑Realtime‑2 ಮತ್ತೊಂದು ಧ್ವನಿ ಮಾದರಿಯಾಗಿದ್ದು, ಬಳಕೆದಾರರೊಂದಿಗೆ ಸಂವಹನ ನಡೆಸಬಹುದಾದ ನೈಜ ಗಾಯನ ಸಿಮ್ಯುಲೇಶನ್ ಅನ್ನು ರಚಿಸಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ. ಆದಾಗ್ಯೂ, ಅದರ ಪೂರ್ವವರ್ತಿಗಿಂತ ಭಿನ್ನವಾಗಿ (GPT-Realtime-1.5), ಇದು GPT-5-ಕ್ಲಾಸ್ ಲಾಜಿಕ್ನೊಂದಿಗೆ ನಿರ್ಮಿಸಲ್ಪಟ್ಟಿದೆ, ಇದು ಬಳಕೆದಾರರ ಹೆಚ್ಚು ಸಂಕೀರ್ಣವಾದ ವಿನಂತಿಗಳನ್ನು ಎದುರಿಸಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ ಎಂದು OpenAI ಹೇಳುತ್ತದೆ.
ಕಂಪನಿಯು GPT‑Realtime‑Translate ಅನ್ನು ಸಹ ಪ್ರಾರಂಭಿಸುತ್ತಿದೆ, ಇದು ಅಂದುಕೊಂಡಂತೆ, ಸಂಭಾಷಣೆಯಲ್ಲಿ ಬಳಕೆದಾರರೊಂದಿಗೆ “ವೇಗವನ್ನು ಇಟ್ಟುಕೊಳ್ಳುವ” ನೈಜ-ಸಮಯದ ಅನುವಾದ ಸೇವೆಗಳನ್ನು ಒದಗಿಸಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ. ಈ ವೈಶಿಷ್ಟ್ಯವು 70 ಕ್ಕೂ ಹೆಚ್ಚು ಇನ್ಪುಟ್ ಭಾಷೆಗಳನ್ನು ಒಳಗೊಂಡಿದೆ (ಅಂದರೆ, ಅದು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಬಹುದಾದ ಭಾಷೆಗಳು) ಮತ್ತು 13 ಔಟ್ಪುಟ್ ಭಾಷೆಗಳು (ಇದು ಸ್ಪೀಕರ್ಗೆ ರಿಲೇ ಮಾಡುವ ಭಾಷೆಗಳು).
ಅಂತಿಮವಾಗಿ, ಕಂಪನಿಯು ಹೊಸ ಪ್ರತಿಲೇಖನ ಸಾಮರ್ಥ್ಯವನ್ನು ಸಹ ಪ್ರಾರಂಭಿಸಿದೆ, GPT-Realtime-Whisper, ಇದು ಬಳಕೆದಾರರಿಗೆ ಸಂವಹನದ ಸಮಯದಲ್ಲಿ ಸೆರೆಹಿಡಿಯಲಾದ ನೇರ ಭಾಷಣ-ಪಠ್ಯ ಸಾಮರ್ಥ್ಯಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ.
“ಒಟ್ಟಿಗೆ, ನಾವು ಪ್ರಾರಂಭಿಸುತ್ತಿರುವ ಮಾದರಿಗಳು ನೈಜ-ಸಮಯದ ಆಡಿಯೊವನ್ನು ಸರಳ ಕರೆ ಮತ್ತು ಪ್ರತಿಕ್ರಿಯೆಯಿಂದ ಧ್ವನಿ ಇಂಟರ್ಫೇಸ್ಗಳ ಕಡೆಗೆ ಚಲಿಸುತ್ತವೆ, ಅದು ನಿಜವಾಗಿ ಕೆಲಸವನ್ನು ಮಾಡಬಹುದು: ಆಲಿಸಿ, ಕಾರಣ, ಅನುವಾದಿಸಿ, ಲಿಪ್ಯಂತರ ಮಾಡಿ ಮತ್ತು ಸಂಭಾಷಣೆ ಪ್ರಾರಂಭವಾದಾಗ ಕ್ರಮ ತೆಗೆದುಕೊಳ್ಳಿ” ಎಂದು ಕಂಪನಿ ಹೇಳಿದೆ.
ಈ ನವೀಕರಣಗಳು ಯಾರಿಗೆ ಒಳ್ಳೆಯದು? ಗ್ರಾಹಕ ಸೇವಾ ಸಾಮರ್ಥ್ಯಗಳನ್ನು ವಿಸ್ತರಿಸಲು ಬಯಸುವ ಕಂಪನಿಗಳು ಸ್ಪಷ್ಟ ಗುರಿಯಾಗಿದೆ. ಆದಾಗ್ಯೂ, OpenAI ತನ್ನ ಹೊಸ ವೈಶಿಷ್ಟ್ಯಗಳು ಶಿಕ್ಷಣ, ಮಾಧ್ಯಮ, ಈವೆಂಟ್ಗಳು ಮತ್ತು ರಚನೆಕಾರರ ಪ್ಲಾಟ್ಫಾರ್ಮ್ಗಳು ಸೇರಿದಂತೆ ಹಲವಾರು ಕ್ಷೇತ್ರಗಳಿಗೆ ಸಹಾಯ ಮಾಡುತ್ತದೆ ಎಂದು ಗಮನಿಸುತ್ತದೆ.
ಎಂಟರ್ಪ್ರೈಸ್ ದೃಷ್ಟಿಕೋನದಿಂದ ಈ ಉಪಕರಣಗಳು ಎಷ್ಟು ಉಪಯುಕ್ತವೆಂದು ತೋರುತ್ತದೆಯಾದರೂ, ಅವುಗಳನ್ನು ದುರುಪಯೋಗಪಡಿಸಿಕೊಳ್ಳುವ ಸಾಧ್ಯತೆಯಿದೆ. ಸ್ಪ್ಯಾಮ್, ವಂಚನೆ ಅಥವಾ ಇತರ ರೀತಿಯ ಆನ್ಲೈನ್ ದುರುಪಯೋಗವನ್ನು ತಡೆಯಲು ತನ್ನ ಹೊಸ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಹೊರತಂದಿದೆ ಎಂದು ಕಂಪನಿ ಹೇಳಿದೆ. “ನಮ್ಮ ಹಾನಿಕಾರಕ ವಿಷಯ ಮಾರ್ಗಸೂಚಿಗಳನ್ನು ಉಲ್ಲಂಘಿಸುವುದು ಕಂಡುಬಂದರೆ ಸಂಭಾಷಣೆಗಳನ್ನು ನಿಲ್ಲಿಸಲು” ಕೆಲವು ಪ್ರಚೋದಕಗಳನ್ನು ಸಿಸ್ಟಮ್ನಲ್ಲಿ ನಿರ್ಮಿಸಲಾಗಿದೆ ಎಂದು OpenAI ಹೇಳಿದೆ.
ಟೆಕ್ಕ್ರಂಚ್ ಘಟನೆ
ಸ್ಯಾನ್ ಫ್ರಾನ್ಸಿಸ್ಕೋ, CA
|
ಅಕ್ಟೋಬರ್ 13-15, 2026
ಎಲ್ಲಾ ಹೊಸ ಧ್ವನಿ ಮಾದರಿಗಳನ್ನು OpenAI ನ ನೈಜ ಸಮಯದ API ಗೆ ನಿರ್ಮಿಸಲಾಗಿದೆ. ಅನುವಾದ ಮತ್ತು ವಿಸ್ಪರ್ ಅನ್ನು ನಿಮಿಷಕ್ಕೆ ಬಿಲ್ ಮಾಡಲಾಗುತ್ತದೆ, ಆದರೆ GPT-ರಿಯಲ್ಟೈಮ್-2 ಅನ್ನು ಟೋಕನ್ ಬಳಕೆಯಿಂದ ಬಿಲ್ ಮಾಡಲಾಗುತ್ತದೆ.
ನಮ್ಮ ಲೇಖನಗಳಲ್ಲಿನ ಲಿಂಕ್ಗಳ ಮೂಲಕ ನೀವು ಖರೀದಿಸಿದಾಗ, ನಾವು ಸಣ್ಣ ಆಯೋಗವನ್ನು ಗಳಿಸಬಹುದು. ಇದು ನಮ್ಮ ಸಂಪಾದಕೀಯ ಸ್ವಾತಂತ್ರ್ಯದ ಮೇಲೆ ಪರಿಣಾಮ ಬೀರುವುದಿಲ್ಲ.