AI: సంగీతంలోనూ బ్యాండ్ మోగిస్తున్న ఎఐ !
ABN, First Publish Date - 2023-04-25T22:15:14+05:30
ఎఐ సాయంతో ఇమేజ్ క్రియేషనే కాదు... ఇప్పుడు ఆడియో క్రియేషన్ కూడా సాధ్యమే! ముఖ్యంగా ఇన్స్ట్రమెంటల్ మ్యూజిక్ క్రియేట్ చేసేందుకు ఇప్పుడు ఎన్నో ఏఐ టూల్స్ వాడుకలోకి వస్తున్నాయి.
ఎఐ సాయంతో ఇమేజ్ క్రియేషనే కాదు... ఇప్పుడు ఆడియో క్రియేషన్ కూడా సాధ్యమే! ముఖ్యంగా ఇన్స్ట్రమెంటల్ మ్యూజిక్ క్రియేట్ చేసేందుకు ఇప్పుడు ఎన్నో ఏఐ టూల్స్ వాడుకలోకి వస్తున్నాయి. చాట్ జీపీటీ లాంటి సంచలనాత్మకమైన చాట్బాట్ ని అందించిన ఓపెన్ ఎఐ... ఇప్పుడు మ్యూజిక్ రంగంలో కూడా ముందడుగు వేసింది. ఓపెన్ ఎఐ వాళ్లు అందిస్తున్న ఒక అద్భుతమైన మ్యూజిక్ టూల్ మ్యూజ్నెట్ గురించి తెలుసుకుందామా?
ఓపెన్ ఏఐ వాళ్లు అందిస్తున్న ఇన్స్ట్రమెంటల్ మ్యూజిక్ టూల్ ... మ్యూజ్ నెట్. ఇది ఒక డీప్ లెర్నింగ్ న్యూరల్ నెట్వర్క్. Textతో మ్యూజిక్ని క్రియేట్ చేసి ఎమ్యూజ్ చేసే అద్భుతమైన ఏఐ టూల్ ఇది. ఇందులో 10 రకాల మ్యూజిక్ డివైజెస్ ఉంటాయి. వాటి సమాచారాన్ని ఈ నెట్వర్క్కి అందించారు. ఆ పది వాద్యాల్నీ వినియోగించుకుని నాలుగైదు నిమిషాల పొడవుండే మ్యూజిక్ కంపోజిషన్స్ని ఈ నెట్వర్క్ outputగా అందించగలదు.
ఈ నెట్వర్క్ ఒక గొప్ప సంగీత విద్వాంసుడి స్థాయిలో మ్యూజిక్ని క్రియేట్ చేయలేకపోవచ్చు కానీ, హార్మోనీ, రిథమ్, స్టైల్... ఇలాంటి సంగీత విశేషాల్ని... రకరకాల పేటర్న్స్ ద్వారా గుర్తుపట్టి .. ఫైనల్గా మ్యూజిక్ ఫైల్స్ని క్రియేట్ చేసి అందిస్తుంది. మిడి అనే పేరు విన్నారుగా? M..I...D...I... (ఎంఐడీఐ మిడీ ) అంటే...Musical Instrument Digital Interface (మ్యూజికల్ ఇన్స్ట్రుమెంట్ డిజిటల్ ఇంటర్ఫేస్ ). ఎలక్ట్రానిక్ డివైజెస్ తాలూకు మ్యూజికల్ టూల్స్ ఒకదాంతో ఒకటి ఇంటరాక్ట్ అయ్యేందుకు తయారయిందే ఈ మిడీ ఇంటర్ఫేస్.... మ్యూజ్ నెట్ టూల్... ఈ మిడీ ఫార్మేట్లోనే మ్యూజిక్ అవుట్పుట్ని అందిస్తుంది.
ఇప్పటికే మ్యూజిక్ని తయారుచేసే అనేక టూల్స్ రెడీగా ఉన్నాయి కానీ, మ్యూజిక్ నెట్ మాత్రం ఎంతో ప్రత్యేకమైనది. ఎందుకంటే ఇది ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ ఆధారంగా తయారు చేసిన టూల్. ఇలా ఎఐ ద్వారా పనిచేసే క్రియేటివ్ టూల్స్ ప్రత్యేకత ఏమిటంటే... అవి అప్పటివరకూ మనం ఇచ్చిన కంటెంట్ ని మార్పులు చేయడమే కాకుండా... కొత్త కంటెంట్ని కూడా ఊహించగలవు. ఉదాహరణకి ఎఐ ఆధారంగా పని చేసే Voice-to-Text టూల్స్ ... మనం ఒక పదం చెప్పినప్పుడు ఆ తరవాతి పదం ఏంటన్నది మనం చెప్పకముందే - ఇది అయి ఉండచ్చు అని ఊహించి సిద్ధంగా ఉంటాయి. ఇలా... "ప్రిడిక్షన్ క్యాపిబిలిటీ" కలిగిన టెక్స్ట్ టూల్స్ మాదిరిగానే సంగీత రూపకల్పన చేసే టూల్స్లో కూడా ఈ శక్తి ఉంటుంది. ఈ మ్యూజ్ నెట్ అలాంటిదే! ఒక నోట్ తరవాత మరి ఏ నోట్ రావచ్చు... పడచ్చు.. అన్నది ఊహించి - ఆ ఊహాశక్తితో మ్యూజిక్ క్రియేట్ చేయగలగడం ఈ మ్యూజ్నెట్ ప్రత్యేకత.
ఈ కాలంలో మనం టెక్స్ట్ ఇచ్చి ఇమేజ్ తయారుచేయగలుగుతున్నాం... అలాగే టెక్స్ట్ ప్రాంప్ట్ ద్వారా.. మ్యూజిక్ని అందించగలిగే సామర్థ్యం ఈ మ్యూజ్ నెట్కి ఉంది. ఉదాహరణకి జాస్, పియానో, బాస్, డ్రమ్స్ అని ఒక Text Prompt ఇస్తే ... వినసొంపైన ఒక చిన్న బీట్ని మంచి స్వరాలతో ఇది మనకి అందించగలుగుతుంది. అలాగే పియానో, గిటార్, బాస్, డ్రమ్స్ ఇలా రకరకాల ఇన్స్ట్రమెంట్స్ తాలూకు పేర్లు ఇస్తే చాలు.. దీంతో మ్యూజిక్ తయారు చేయచ్చు. ఇచ్చిన ఇన్స్ట్రమెంట్స్ని ర్యాండమ్ సెలెక్ట్ చేసుకుని మ్యూజిక్ ప్లే చేయగలుగుతుంది మ్యూజ్నెట్ .. అంత మాత్రమే కాదు... నాకు మ్యూజిక్ ఫలానా మ్యూజిషియన్ స్టైల్లోనే కావాలి అని అడిగినా ఈ టూల్ ఆ విధంగా అవుట్పుట్ని తయారు చేయగలుగుతుంది.
అయితే ఒకోసారి సంబంధం లేని రెండు రకాల స్టైల్స్ని ఇచ్చి అడిగినప్పుడు... ఇది కొంత కన్ఫ్యూజన్కి గురవుతోంది. ఇంకా ఈ టూల్ అభివృద్ధి దశలో ఉండడం వల్లే కొన్ని పొరబాట్లు జరుగుతున్నాయి. అయినప్పటికీ ఆసక్తికరమైన outputనే అందించగలుగుతోంది మ్యూజ్నెట్. ఉదాహరణకి మనం ఈ టూల్కి ఒక ఫలానా మ్యూజిక్ డైరెక్టర్ క్రియేట్ చేసిన పాటలు కొన్ని ఇచ్చి.. అలాగే కొన్ని పాప్ సాంగ్స్ ని కూడా ఇన్పుట్గా ఇచ్చామనుకోండి.. ఇదుగో ఆ ఫలానా మ్యూజిక్ డైరెక్టర్... ఒక కొత్త పాప్ సాంగ్ క్రియేట్ చేస్తే ఎలాంటి స్వరాలు సమకూరుస్తాడు? - అని అడిగితే ఈ మ్యూజ్నెట్ టూల్ .. మంచి అవుట్పుట్ని ఊహించి అందించగలుగుతుంది. అంటే... ఇందులో ఇంక్లూడ్ చేసిన మ్యూజిక్ ఫైల్స్నీ స్టయిల్స్నీ ఆధారంగా చేసుకుని కొత్త సంగీతాన్ని ఇది క్రియేట్ చేయగలుగుతుంది. రెండు రకాల సంగీతాల్నీ, రెండు రకాల స్టైల్స్నీ మేళవించగలిగే నైపుణ్యం కూడా ఈ టూల్కి బాగా ఉంది.
మ్యూజ్నెట్లో సింపుల్ మోడ్, ఎడ్వాన్స్డ్ మోడ్ అనే రెండు విధాలున్నాయి. సింపుల్ మోడ్లో జనరల్గా మనం కొన్ని మ్యూజిక్ స్టైల్స్ని తయారు చేసుకుని వినచ్చు. అదే ఎడ్వాన్స్డ్ మోడ్లో అయితే - మనం పూర్తిగా ఆ మోడల్తో ఇంటరాక్ట్ కావచ్చు... కావలసిన విధంగా మ్యూజిక్ని కష్టమైస్జ్ చేసి - మన ఇష్టానికి అనుగుణంగా అవుట్పుట్ని పొందచ్చు. మ్యూజ్నెట్ టూల్.. ఫైనల్గా క్రియేట్ చేసిన ఆడియో మ్యూజిక్ ఫైల్స్ని mp3, Wav (వేవ్), Ogg (ఆగ్), Midi ( మిడీ ) ఇలా రకరకాల ఫార్మేట్స్లో సేవ్ చేసుకోవచ్చు. అయితే మ్యూజిక్ నెట్కి కొన్ని లిమిటేషన్స్ అయితే ఉన్నాయి. ఇది ఇచ్చిన ఇన్పుట్ ఆధారంగా కొత్త సంగీతాన్ని రూపొందించేటప్పుడు తరవాతి నోట్ ఏది వేద్దాం ఆలోచించే ప్రాసెస్లో రకరకాలుగా ఆలోచిస్తుంటుందట. అలాంటప్పుడు ఒక్కోసారి తప్పుడు స్వరాలు... అర్థం లేని తాళాలు రూపొందవచ్చు కూడా! అయితే - ఎఐ బేస్డ్ టూల్స్లో ఇది కామనే!
ఉదాహరణకి మనం జనరేటివ్ ఏఐ టూల్స్ని వాడుతున్నప్పుడు - Text -to – Image పద్ధతిలో ఇమేజెస్ తయారు చేస్తున్నప్పుడు - ఒకోసారి పిచ్చి పిచ్చి బొమ్మలు కూడా వస్తుంటాయి. నాలుగేసి చేతులు, రెండేసి తలలు.. మెడలు కలిసిపోయే బొమ్మలు ఇలా వస్తుంటాయి. ఇక్కడ కూడా అంతే! ముఖ్యంగా రెండు మ్యూజిక్ స్టయిల్స్ని కలిపేటప్పుడు మ్యూజిక్ పరంగా కూడా కొన్ని మిస్టేక్స్ కలిగిన output రావడం జరుగుతుంటుంది. ఇది సాధారణమే!
మ్యూజ్ నెట్ తయారు చేసిన మ్యూజిక్ని మనం దృశ్య రూపంలో చూడచ్చు. దీన్నే విజువలైజేషన్ అంటాం. అందువల్ల లాభం ఏంటంటే... మ్యూజిక్ క్రియేషన్ మీద మనకి మంచి అవగాహన ఏర్పడుతుంది. ఎఐతో మ్యూజిక్ జనరేట్ చేసే ఈ పద్ధతిని ట్రాన్స్ఫార్మర్ విధానం అంటారు. ఇలాంటి మ్యూజిక్ ట్రాన్స్ఫార్మర్స్ ఇంకా చాలా వస్తున్నాయి. ఉదాహరణకి మెజెంటాకి చెందిన పియానో నెట్వర్క్ అనే మరో టూల్ కూడా దాదాపు ఇలాంటి టెక్నాలజీ తోనే తయారయింది.
సరే. ఎఐ టూల్ ఏదయినా... ఇప్పుడు ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ ద్వారా రూపొందుతున్న మ్యూజిక్ ఎంతోమంది మ్యూజిక్ క్రియేటర్స్కి కూడా నచ్చుతోంది. ఎఐ ఇంజిన్ అందించిన క్రియేటివ్ నోట్స్ని- రియల్ మ్యూజిషియన్స్ కూడా ఇష్టంతో ప్లే చేస్తూ ఎంతో ఆనందాన్ని పొందుతున్నారు. అంతే కాదు.. ఎఐ తయారు చేసిన మ్యూజిక్ పేటర్న్స్ని వాళ్లు అబ్జర్వ్ చేస్తూ.... తద్వారా మరింత మంచి సంగీతాన్ని క్రియేట్ చేయడంలో మెలకువల్ని తెలుసుకునే ప్రయత్నం చేస్తున్నారు. అంటే... సంగీతాన్ని క్రియేట్ చేయడంలో ఇప్పటివరకూ... మనిషి తన ఇన్పుట్ని ఇచ్చి... మెషిన్కి హెల్ప్ చేస్తే... ఇప్పుడు రివర్స్లో మరింత మంచి సంగీతాన్ని తయారుచేసుకోవడానికి మిషనే మనిషికి హెల్ప్ చేస్తోందన్నమాట. ఏఐయా? మజాకా?
Updated Date - 2023-04-25T22:19:47+05:30 IST