GèneUn gène, du grec ancien (« génération, naissance, origine »), est, en biologie, une séquence discrète et héritable de nucléotides dont l'expression affecte les caractères d'un organisme. L'ensemble des gènes et du matériel non codant d'un organisme constitue son génome. Un gène possède donc une position donnée dans le génome d'une espèce, on parle de locus génique. La séquence est généralement formée par des désoxyribonucléotides, et est donc une séquence d'ADN (par des ribonucléotides formant de l'ARN dans le cas de certains virus), au sein d'un chromosome.
GlobineLes globines sont des protéines globulaires dont on pense qu'elles partagent un ancêtre commun, c'est-à-dire qu'elles forment une famille de protéines. Elles présentent toutes le repliement globine, qui fait intervenir huit hélices α. Ce sont des hémoprotéines intervenant dans le stockage ou le transport de l'oxygène : la myoglobine et l'hémoglobine sont deux membres éminents de cette famille, présente chez de très nombreux êtres vivants.
Base de données biologiquesLes bases de données biologiques sont des bibliothèques répertoriant des informations sur les sciences de la vie collectées grâce à des expériences scientifiques, à la littérature publiée, aux technologies expérimentales à haut débit, et aux analyses informatiques. Elles contiennent des informations venant de divers champs de recherche tels que la génomique, la protéomique, la métabolomique, la phylogénétique et les puces à ADN.
Duplication (génétique)En génétique, la duplication génétique correspond à la multiplication de matériel génétique sur un chromosome. Il existe plusieurs mécanismes qui résultent de la duplication soit d'une large portion chromosomique, soit d'un gène ou bien d'une suite nucléotidique. Ces remaniements du génome représentent un moteur important dans l'évolution des génomes. Le doublement d'un gène crée une copie supplémentaire dégagée de la pression de sélection, ce qui peut permettre à la copie de muer à nouveau sans conséquences nuisibles à l'organisme.
Alignement de séquencesEn bio-informatique, l'alignement de séquences (ou alignement séquentiel) est une manière de représenter deux ou plusieurs séquences de macromolécules biologiques (ADN, ARN ou protéines) les unes sous les autres, de manière à en faire ressortir les régions homologues ou similaires. L'objectif de l'alignement est de disposer les composants (nucléotides ou acides aminés) pour identifier les zones de concordance. Ces alignements sont réalisés par des programmes informatiques dont l'objectif est de maximiser le nombre de coïncidences entre nucléotides ou acides aminés dans les différentes séquences.
Séquence conservéeEn biologie de l'évolution, les séquences conservées sont des séquences d'acides nucléiques (ADN et ARN) ou d'acide aminés identiques ou similaires au sein d'un génome (on parle alors de séquences paralogues) ; à travers les espèces (on parle alors de séquences orthologues), ou bien encore entre un taxon donneur et un taxon récepteur (on parle alors de séquences xénologues). La conservation indique qu'une séquence a été maintenue par la sélection naturelle.
Séquençage des protéinesLe séquençage des protéines est la détermination de la séquence polypeptidique. Elle est destinée à connaître le nombre, la nature chimique et l'ordre de tous les résidus d'acides aminés dans un polypeptide. Pour cela, si la protéine contient plus d'une chaîne polypeptidique, les chaînes doivent être d'abord séparées, puis purifiées. Généralement, toutes les liaisons disulfures seront réduites et les thiols ainsi obtenus alkylés.
Famille de protéinesUne famille de protéines est un ensemble de protéines généralement codées par une famille de gènes. Les familles de protéines regroupent des protéines ayant des caractéristiques proches en termes de structure, de fonction enzymatique et de fonction cellulaire. Le terme famille de protéines peut être employé pour décrire un groupe de protéines non apparentées mais partageant une fonction commune, par exemple, les protéines de choc thermique, la désignation correcte serait ici de parler de classe de protéines.
Dernier ancêtre communEn biologie de l'évolution, le concept de dernier ancêtre commun (DAC) à deux lignées d'êtres vivants, ou cénancêtre, correspond à l'espèce la plus récente que ces deux taxons ont pour ancêtre commun. Cette espèce, qui correspond au dernier nœud de l'arbre phylogénétique à partir duquel divergent les branches de chacune des lignées en question, est le plus souvent difficilement identifiable dans la pratique. Le dernier ancêtre commun à deux ou plusieurs individus est une notion distincte qu'il importe de ne pas confondre avec la précédente.
Homologie (évolution)En biologie de l'évolution, une homologie désigne un lien évolutif entre deux traits (en général anatomiques) observés chez deux espèces différentes, qui est dû au fait que toutes deux l'ont hérité d'un ancêtre commun. Ces traits sont alors dits homologues. Ce peut être des caractères anatomiques, ou moléculaires (protéines homologues). Ce terme s'étend aussi aux séquences génétiques (de l'ADN). Le terme homologie est un concept fondamental pour la biologie en ce qui concerne l’organisation d’un organisme.
Arbre phylogénétiquevignette|upright=1.5|Arbre phylogénétique, basé sur le génome d'après Ciccarelli et al. (2006), mettant en évidence les trois domaines du vivant : les eucaryotes en rose (animaux, champignons, plantes et protistes), les bactéries en bleu, et les archées en vert. Un arbre phylogénétique est un arbre schématique qui montre les relations de parenté entre des groupes d'êtres vivants. Chacun des nœuds de l'arbre représente l'ancêtre commun de ses descendants ; le nom qu'il porte est celui du clade formé des groupes frères qui lui appartiennent, non celui de l'ancêtre qui reste impossible à déterminer.
Boîte homéotiquethumb|upright=1.3|Figure 1: Représentation d'une boîte homéotique sur une séquence d'ADN thumb|upright=1.3|Figure 2 : Homéodomaine du gène Antennapedia de Drosophila melanogaster lié à un fragment d’ADN, illustrant les interactions de l’hélice de reconnaissance (hélice 3) et de l’extrémité N-terminal avec le sillon majeur et mineur de la double hélice d’ADN Une boîte homéotique (appelée aussi homéoboîte, homeobox en anglais) est une séquence d'ADN qu'on retrouve dans certains gènes essentiels au développement embryonnaire, la morphogenèse, des animaux, des champignons et des plantes.
Structural alignmentStructural alignment attempts to establish homology between two or more polymer structures based on their shape and three-dimensional conformation. This process is usually applied to protein tertiary structures but can also be used for large RNA molecules. In contrast to simple structural superposition, where at least some equivalent residues of the two structures are known, structural alignment requires no a priori knowledge of equivalent positions.
LysineLa lysine (abréviations IUPAC-IUBMB : Lys et K) est un acide dont l'énantiomère L est l'un des aminés protéinogènes, et l'un des neuf acides aminés essentiels pour l'homme. Elle est codée sur les ARN messagers par les codons AAA et AAG. Elle est caractérisée par la présence d'une fonction amine primaire à l'extrémité de sa chaîne latérale, ce qui en fait un résidu basique dans les protéines, tout comme l'arginine et l'histidine. Le peptide poly-lysine est un polymère de plusieurs lysines.
Évolution moléculaireL'évolution moléculaire ou évolution du génome correspond à l'ensemble des modifications d ́un génome au cours de générations successives au sein d'une population. C'est le moteur de l'évolution des espèces. L ́étude de l ́évolution moléculaire des génomes tente d'expliquer les changements biologiques au niveau moléculaire et cellulaire. Ceci met en jeu plusieurs disciplines telles que la biologie moléculaire, la génétique, la génomique et la bio-informatique.
IntronUn intron est une portion d'un gène qui est transcrite en ARN, au sein d'un ARN précurseur, et qui est ensuite éliminée par un processus d'excision programmé et qu'on ne retrouve donc pas dans l'ARN mature. On trouve principalement des introns dans les gènes codant des protéines, où ils sont présents dans l'ARN pré-messager et excisés dans l'ARNm mature. Les introns sont donc des régions non codantes. On trouve aussi des introns dans des gènes codant des ARN non codants comme les ARN ribosomiques ou les ARN de transfert.
Super-famille de protéinesUne superfamille (ou super-famille) de protéines est le regroupement le plus large (clade) de protéines pour lesquelles il est possible d'identifier un ancêtre commun par homologie. Cet ancêtre commun est généralement déduit par et similitude mécanique, même lorsque aucune similitude entre les séquences n'est détectable. Les super-familles contiennent généralement plusieurs familles de protéines présentant des similitudes de séquences au sein de ces familles.