Actuellement étudiant en cours de Bio-Informatique, notre prof nous invite à nous auto-former sur différent langage (on aborde le Python uniquement en cours pour l'instant).
Dans le cadre d'un projet d'annotation, j'ai du à partir d'une séquence d'ADN trouvé les zones codantes pour des protéines. Pour faciliter la suite de mon annotation, je doit extraire chacune de ces zones de mon fichier.
Je pensais donc réalisé un petit script en bash me permettant de réaliser ce découpage. Les résultats sont là, mais avant de le soumettre dans mon rapport de projet, j'aurai aimé savoir s'il y avait des erreurs grossières dans la rédaction de celui-ci. Mon fichier initial est un fichier au format FASTA qui se présente comme ceci :
J'ai cherché pas mal de lecture sur sed, et j'ai pas trouvé comment supprimer le retour à la ligne ou extraire une partie de ma ligne en me basant sur les positions des caractères dans la ligne et non pas sur des mots.
Quand je saisie mon START et mon STOP, c'est les positions dans la séquence. Par exemple :
ORF_1 1 207
ORF_2 307 669
...
Du coup je voudrais extraire un "bout" de ma ligne qui fait 7500 caractères correspondant au fragment entre les positions 1 et 207 (avec 207 exclue).
Validez la réponse utile « Un problème clairement exposé est à moitié résolu. » Pas de MP technique
[bash] Avis sur un script
× Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
× Attention, ce sujet est très ancien. Le déterrer n'est pas forcément approprié. Nous te conseillons de créer un nouveau sujet pour poser ta question.
Validez la réponse utile « Un problème clairement exposé est à moitié résolu. » Pas de MP technique
Validez la réponse utile « Un problème clairement exposé est à moitié résolu. » Pas de MP technique